5-1. Logistic (regression) classification

2022. 4. 30. 14:46·AI/머신러닝(딥러닝) 정리

지금까지 회기(regression)이라는 내용의 함수를 공부하고 머신러닝에 적용하는 방식을 알아보았다.

이제 우리는 분류(Classification)라는 방식을 알아 볼 것이다.

 

분류란?

스팸메일 분류, 페이스북 피드 숨길것 안숨길것 등과 같은 분류를 하는 것에 사용 할 수 있다.

우리가 분류를 하기 위해서는 알아야 할 것이 있다.

0, 1 encoding 이라는 one hot encoding 이다.

원핫 인코딩은 말그대로 0과 1로 데이터를 분류하고 1이 뜨겁다. 라는 뜻을 의미하며

1만에 주목을 한다는 것이다.

 

예를들어, 

스팸메일에서 spam(1), ham(0) 이라 하거나 0은 버리고 1이라는 것에 집중을 한다는 것이다.

다른 예를 들어보자

우리는 시험 공부 시간에 따라 시험의 pass, fail을 알아볼것이다. 참고로 pass는 1 fail은 0이다.

이걸 우리는 y = wx +b 우리가 아는 함수에 적용하면 문제가 생긴다. 데이터의 갯수에 따라 다양한 그래프가 생기게 되며 그사이에 많은 오차가 존재하게 된다.

우리는 이런 함수를 과연 분류를 하는 것에 사용 할 수 있을까?

선형 회기 (Linear Regression)으로는 정확한 분류를 하기 힘들다. 

따라서 우리는 다른 방식의 적절한 함수를 찾기 시작했고 찾은 함수는 바로

이 함수이다. 이 함수를 우리는 sigmoid function이라 말하고 logistic function 이라 말한다.

따라서 우리는 새로운 가설을 구하는 방식으로 설정한다.

새로운 가설 값을 구하는 함수에 우리가 하는 함수를 넣게 되며 분류에는 이방식을 사용한다.

반응형

'AI > 머신러닝(딥러닝) 정리' 카테고리의 다른 글

6-1. softmax classification (Multinomial classification)  (0) 2022.05.02
5-2. Logistic (regression) classification: cost function & gradient decent  (0) 2022.05.01
4. 다양한 변수 선형 회기  (0) 2022.04.30
3. 어떻게 cost(loss) 비용, 손실을 작게 만들까  (0) 2022.04.30
2. Linear Regression (선형 회기)  (0) 2022.04.29
'AI/머신러닝(딥러닝) 정리' 카테고리의 다른 글
  • 6-1. softmax classification (Multinomial classification)
  • 5-2. Logistic (regression) classification: cost function & gradient decent
  • 4. 다양한 변수 선형 회기
  • 3. 어떻게 cost(loss) 비용, 손실을 작게 만들까
코딩 코딩 코오딩
코딩 코딩 코오딩
  • 코딩 코딩 코오딩
    코딩하는 누누
    코딩 코딩 코오딩
  • 전체
    오늘
    어제
    • 분류 전체보기 (491)
      • 생산성 (2)
        • 인텔리제이 (2)
      • 프로젝트 기록 (14)
        • git (2)
        • spring (3)
        • TestCode (2)
        • spring security (3)
        • 기타 (2)
        • MySQL (0)
        • Cloud (2)
      • 회고 (4)
      • Spring (6)
      • JPA (0)
      • DB (4)
        • MySql (2)
        • Redis (1)
      • Java (7)
        • JSP (1)
      • 잡담 (1)
      • CS (30)
        • 컴퓨팅 사고 (0)
        • 배열 (4)
        • 알고리즘 (8)
        • 메모리 (7)
        • 자료구조 (9)
        • 암호학 (2)
      • opencv (14)
      • AI (56)
        • 머신러닝 (2)
        • 딥러닝 (7)
        • tensorflow (3)
        • 머신러닝(딥러닝) 정리 (21)
        • 강화학습 (7)
        • 논문 읽기 (1)
        • 잡동사니 (1)
        • python AI (13)
        • 선형대수 (1)
        • 확률론 (0)
      • 알고리즘 공부 (177)
        • 그래프 이론 (0)
        • 다익스트라 (4)
        • 위상정렬 (3)
        • 신장트리-크루스칼 알고리즘 (4)
        • 플로이드 워셜 (3)
        • 이진탐색 (9)
        • 백트래킹 (11)
        • 부르드포스 (9)
        • 다이나믹 프로그래밍 (20)
        • BFS & DFS (24)
        • 그리디 (6)
        • 구현 (15)
        • 정렬 (3)
        • 기타 (62)
        • 수학? (1)
      • 코딩 (173)
        • 파이썬(python) (15)
        • c언어 (13)
        • 프로그래머스 lv1 (46)
        • 프로그래머스 lv2 (41)
        • 백준 - c++ (49)
        • Softeer (9)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    c언어
    BFS
    소수찾기
    인접행렬
    코딩
    자료구조
    스택
    삽입 정렬
    다이나믹 프로그래밍
    에라토슽네스의 체
    왜곡보정
    프로그래머스
    캘리브레이션
    그리디
    코딩기초
    순차 탐색
    C언어 기초
    코딩테스트
    DFS
    코딩기초스킬
    백준
    인접리스트
    큐
    n진법 변환
    이미지처리
    선택정렬
    정렬
    코딩문제
    알고리즘
    if문
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
코딩 코딩 코오딩
5-1. Logistic (regression) classification
상단으로

티스토리툴바