7-2. Learning and test data sets

2022. 5. 3. 19:51·AI/머신러닝(딥러닝) 정리

우리가 학습을 할때 그냥 모든 데이터를 학습 시킨 후,  그 데이터를 이용해서 다시 검증을 하게 된다면 그게 올바른 검증일까? 당연히 아니다. 왜냐? 공부했던 문제로 다시 시험을 보면 당연히 다 맞추기 때문이다. 우리는 이러한 문제를 해결하기 위해 데이터 셋을 학습 셋과 테스트 셋으로 나누며 검증을 하게 된다.

위와 같은 방법에서 더 나아가 데이터 셋을 3등분한다. 같게 등분하는 것은 아니고 3가지의 부분으로 나눈다. 학습, 검증, 테스트 이렇게 나누는데 검증은 그냥 모의고사라 생각하면되고 test 가 수능이라고 생각하면 쉽다. 이러한 방식으로 하게 된다면 더욱 확실한 성능에 대한 평가가 가능해지며 학습능력도 더욱 좋아지게 된다.

다음은 데이터 셋이 너무 많은 경우 한번에 학습을 하기 힘들때 사용하는 방법이다. 한번에 메모리에 올리기 힘든 경우에 많이 사용하는 방법이다.

online learning 이란 계속 이어서 학습을 시키는 것을 의미 한다. 예를 들어 100만개의 데이터를 10만개씩 나누어 학습을 하는 방법을 말한다. 

끝

반응형

'AI > 머신러닝(딥러닝) 정리' 카테고리의 다른 글

8-2. Deep Neural Nets  (0) 2022.05.04
8-1. Deep Neural Nets  (0) 2022.05.04
7-1. Learning rate, data preprocessing, overfitting  (0) 2022.05.03
6-2. softmax classification (softmax and cost function)  (0) 2022.05.02
6-1. softmax classification (Multinomial classification)  (0) 2022.05.02
'AI/머신러닝(딥러닝) 정리' 카테고리의 다른 글
  • 8-2. Deep Neural Nets
  • 8-1. Deep Neural Nets
  • 7-1. Learning rate, data preprocessing, overfitting
  • 6-2. softmax classification (softmax and cost function)
코딩 코딩 코오딩
코딩 코딩 코오딩
  • 코딩 코딩 코오딩
    코딩하는 누누
    코딩 코딩 코오딩
  • 전체
    오늘
    어제
    • 분류 전체보기 (491)
      • 생산성 (2)
        • 인텔리제이 (2)
      • 프로젝트 기록 (14)
        • git (2)
        • spring (3)
        • TestCode (2)
        • spring security (3)
        • 기타 (2)
        • MySQL (0)
        • Cloud (2)
      • 회고 (4)
      • Spring (6)
      • JPA (0)
      • DB (4)
        • MySql (2)
        • Redis (1)
      • Java (7)
        • JSP (1)
      • 잡담 (1)
      • CS (30)
        • 컴퓨팅 사고 (0)
        • 배열 (4)
        • 알고리즘 (8)
        • 메모리 (7)
        • 자료구조 (9)
        • 암호학 (2)
      • opencv (14)
      • AI (56)
        • 머신러닝 (2)
        • 딥러닝 (7)
        • tensorflow (3)
        • 머신러닝(딥러닝) 정리 (21)
        • 강화학습 (7)
        • 논문 읽기 (1)
        • 잡동사니 (1)
        • python AI (13)
        • 선형대수 (1)
        • 확률론 (0)
      • 알고리즘 공부 (177)
        • 그래프 이론 (0)
        • 다익스트라 (4)
        • 위상정렬 (3)
        • 신장트리-크루스칼 알고리즘 (4)
        • 플로이드 워셜 (3)
        • 이진탐색 (9)
        • 백트래킹 (11)
        • 부르드포스 (9)
        • 다이나믹 프로그래밍 (20)
        • BFS & DFS (24)
        • 그리디 (6)
        • 구현 (15)
        • 정렬 (3)
        • 기타 (62)
        • 수학? (1)
      • 코딩 (173)
        • 파이썬(python) (15)
        • c언어 (13)
        • 프로그래머스 lv1 (46)
        • 프로그래머스 lv2 (41)
        • 백준 - c++ (49)
        • Softeer (9)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    에라토슽네스의 체
    n진법 변환
    소수찾기
    c언어
    프로그래머스
    코딩테스트
    스택
    삽입 정렬
    큐
    정렬
    자료구조
    코딩문제
    BFS
    코딩
    백준
    왜곡보정
    순차 탐색
    그리디
    이미지처리
    인접행렬
    다이나믹 프로그래밍
    코딩기초
    C언어 기초
    if문
    캘리브레이션
    DFS
    알고리즘
    선택정렬
    코딩기초스킬
    인접리스트
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
코딩 코딩 코오딩
7-2. Learning and test data sets
상단으로

티스토리툴바