8-2. Deep Neural Nets

2022. 5. 4. 11:42·AI/머신러닝(딥러닝) 정리

암흑기가 찾아온 딥러닝에는 다시 획기적인 사건이 찾아온다.

1. 뉴럴 네트워크에 많은 층을 잘 학습하려면, 초기의 w 값을 랜덤으로 주는 것보다는 잘 주면 학습이 아주 잘된다.

(초기에 설정해주는 w 값이 중요하다는 말이다.)

2. 깊게된 신경망은 복잡한 문제를 해결 가능하다.

3. 이제 뉴럴 네트워크라 하지 않고 딥러닝이라 이름을 바꾸겠다.(이 당시 뉴럴 네트워크라는 이름으로 논문을 내면 바로 reject을 당했다고 한다.ㅋㅋ)

 

이런걸 말로만하면 사람들은 안믿어주겠지만 여러 대회에서 성능을 입증했다고 한다.(imagenet과 같은 대회 역시 해외든 우리나라든 결과를 중요시 하는 거 같다.)

참고로 예전이지만 사람과 대결에서 그 사람을 딥러닝이 처음 이겼던 때가 2015년이란다. 그 사람은 일반적인 사람도 아닌 스탠포드 대학생이라고 한다.

 

이렇게 딥러닝은 발전하게 되고 다양한 방식으로 사용이 되고 있다. 

문장번역 그림번역, 알파고 등등~~

 

이러한 발전에 힌튼 교수님은 예전에는 왜 잘 안됐는지 몇 가지를 발견했다.(이 발견은 지금에 비하면 몇년 전의 내용이다.)

여기까지는 간단한 내용의 딥러닝이었으며 이제 다음 시간에 더욱 자세히 알아보자

반응형

'AI > 머신러닝(딥러닝) 정리' 카테고리의 다른 글

9-2. Backpropagation  (0) 2022.05.04
9-1. Neural Nets(NN) for XOR  (0) 2022.05.04
8-1. Deep Neural Nets  (0) 2022.05.04
7-2. Learning and test data sets  (0) 2022.05.03
7-1. Learning rate, data preprocessing, overfitting  (0) 2022.05.03
'AI/머신러닝(딥러닝) 정리' 카테고리의 다른 글
  • 9-2. Backpropagation
  • 9-1. Neural Nets(NN) for XOR
  • 8-1. Deep Neural Nets
  • 7-2. Learning and test data sets
코딩 코딩 코오딩
코딩 코딩 코오딩
  • 코딩 코딩 코오딩
    코딩하는 누누
    코딩 코딩 코오딩
  • 전체
    오늘
    어제
    • 분류 전체보기 (491)
      • 생산성 (2)
        • 인텔리제이 (2)
      • 프로젝트 기록 (14)
        • git (2)
        • spring (3)
        • TestCode (2)
        • spring security (3)
        • 기타 (2)
        • MySQL (0)
        • Cloud (2)
      • 회고 (4)
      • Spring (6)
      • JPA (0)
      • DB (4)
        • MySql (2)
        • Redis (1)
      • Java (7)
        • JSP (1)
      • 잡담 (1)
      • CS (30)
        • 컴퓨팅 사고 (0)
        • 배열 (4)
        • 알고리즘 (8)
        • 메모리 (7)
        • 자료구조 (9)
        • 암호학 (2)
      • opencv (14)
      • AI (56)
        • 머신러닝 (2)
        • 딥러닝 (7)
        • tensorflow (3)
        • 머신러닝(딥러닝) 정리 (21)
        • 강화학습 (7)
        • 논문 읽기 (1)
        • 잡동사니 (1)
        • python AI (13)
        • 선형대수 (1)
        • 확률론 (0)
      • 알고리즘 공부 (177)
        • 그래프 이론 (0)
        • 다익스트라 (4)
        • 위상정렬 (3)
        • 신장트리-크루스칼 알고리즘 (4)
        • 플로이드 워셜 (3)
        • 이진탐색 (9)
        • 백트래킹 (11)
        • 부르드포스 (9)
        • 다이나믹 프로그래밍 (20)
        • BFS & DFS (24)
        • 그리디 (6)
        • 구현 (15)
        • 정렬 (3)
        • 기타 (62)
        • 수학? (1)
      • 코딩 (173)
        • 파이썬(python) (15)
        • c언어 (13)
        • 프로그래머스 lv1 (46)
        • 프로그래머스 lv2 (41)
        • 백준 - c++ (49)
        • Softeer (9)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    if문
    캘리브레이션
    정렬
    자료구조
    n진법 변환
    순차 탐색
    큐
    C언어 기초
    알고리즘
    에라토슽네스의 체
    다이나믹 프로그래밍
    DFS
    인접행렬
    왜곡보정
    코딩문제
    코딩테스트
    c언어
    선택정렬
    코딩기초
    인접리스트
    백준
    BFS
    스택
    이미지처리
    코딩
    삽입 정렬
    코딩기초스킬
    그리디
    소수찾기
    프로그래머스
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
코딩 코딩 코오딩
8-2. Deep Neural Nets
상단으로

티스토리툴바