4. 다양한 변수 선형 회기

2022. 4. 30. 14:42·AI/머신러닝(딥러닝) 정리

다양한 변수가 무엇이냐? 예시를 들어보면

y = w1*x1 + w2*x2 + w3*x3 와 같이 데이터에 들어오는 변수가 다양하다는 뜻이다.

딥러닝에는 다양한 변수가 존재할 수 있으므로 이러한 변수에 맞게 가중치 값 바이어스 값도 정해야한다.

 

머신 러닝에 필요한 것이 뭔지 다시 리마인드 해보자

가설값, 비용(손실)함수, 경사하강법 

우리는 이 3가지를 우선 알고 있어야 한다. 그래야 머신러닝을 할 수 있다.

 

그러면 예시를 보고 이해를 해보자

이렇게 표현을 할 수 있다. 근데 여기서 왜? b(bias) 값은 하나지?

라는 의문이 생길 수 있다. 특별한 이유는 없다. 그냥 b값은 그냥 하나 주는 것이다. 크게 의미를 둘 필요 없다.

w(weight, 가중치)는 가중치라는 이름이 있듯이 데이터 값에 영향을 주는 값이므로 각각의 데이터에 맞는 값이 정해지지만 그냥 바이어스 값은 하나로 뭉뚱그려 생각한다고 생각하는 것이 편하다.

하지만 이제 한가지를 여기에 더 추가를 해보겠다.

x1, x2, x3 -------- xn 이라는 값이 많고 이러한 데이터의 수가 증가하게 된다면 우리는 수식으로 표현하기에 많이 불편해진다. 우리는 이런 계산을 편하게 표시하기 위해 배운 것이 행렬이다. 우리는 고등학교 시절에 행렬이라는 연산을 왜 배울까? 라고 의문을 가졌지만 딥러닝에서 행렬은 아주 강력한 힘을 나타 낼 수 있다.

참고로 우리가 말하는 x1, x2, x2 ---- xn 같은 데이터를 많은 사람들은 feature(특징) 값이라고도 많이 말하니 알고 있어두면 좋다. 머신러닝에서는 다양한 용어를 사용하는 사람이 많은데 꼭! 알고 있어야 한다. 무슨 학문이든 의사 소통이 중요한 만큼 그 학문에서 사용되는 용어를 알고 있어야한다는 것이 개인적으로 중요하다고 생각한다.

사실 내가 사용하는 용어도 사람들이 헷갈려 할수 있다는 것도 문제이다ㅋㅋㅋ 그리고 틀린 부분있으면 댓글 달아주시면 감사하겠습니다.

나는 이해했지만 만약에 읽어보고 의문이 생기는 부분이 있는 분들은 댓글을 남겨주세요!

 

여기서 말하는 instance (인스턴스)는 데이터의 수 예를들어 철수의 데이터, 영희의 데이터, 민수의 데이터와 같이 각가의 데이터를 instance라고 한다. 여기서 인스턴스는 3개이다.

 

 

우리는 이렇게 다양한 변수가 있을 때 딥러닝은 어떻게 처리할까?

라는 것을 이번 장에서 알아보았다. 그리고 w의 모양은 어떤 모양일까 라는 것을 데이터의 형태와 라벨의 형태로 유추가 가능하다.

끝

반응형

'AI > 머신러닝(딥러닝) 정리' 카테고리의 다른 글

5-2. Logistic (regression) classification: cost function & gradient decent  (0) 2022.05.01
5-1. Logistic (regression) classification  (0) 2022.04.30
3. 어떻게 cost(loss) 비용, 손실을 작게 만들까  (0) 2022.04.30
2. Linear Regression (선형 회기)  (0) 2022.04.29
1. 머신 러닝 기초  (0) 2022.04.29
'AI/머신러닝(딥러닝) 정리' 카테고리의 다른 글
  • 5-2. Logistic (regression) classification: cost function & gradient decent
  • 5-1. Logistic (regression) classification
  • 3. 어떻게 cost(loss) 비용, 손실을 작게 만들까
  • 2. Linear Regression (선형 회기)
코딩 코딩 코오딩
코딩 코딩 코오딩
  • 코딩 코딩 코오딩
    코딩하는 누누
    코딩 코딩 코오딩
  • 전체
    오늘
    어제
    • 분류 전체보기 (491)
      • 생산성 (2)
        • 인텔리제이 (2)
      • 프로젝트 기록 (14)
        • git (2)
        • spring (3)
        • TestCode (2)
        • spring security (3)
        • 기타 (2)
        • MySQL (0)
        • Cloud (2)
      • 회고 (4)
      • Spring (6)
      • JPA (0)
      • DB (4)
        • MySql (2)
        • Redis (1)
      • Java (7)
        • JSP (1)
      • 잡담 (1)
      • CS (30)
        • 컴퓨팅 사고 (0)
        • 배열 (4)
        • 알고리즘 (8)
        • 메모리 (7)
        • 자료구조 (9)
        • 암호학 (2)
      • opencv (14)
      • AI (56)
        • 머신러닝 (2)
        • 딥러닝 (7)
        • tensorflow (3)
        • 머신러닝(딥러닝) 정리 (21)
        • 강화학습 (7)
        • 논문 읽기 (1)
        • 잡동사니 (1)
        • python AI (13)
        • 선형대수 (1)
        • 확률론 (0)
      • 알고리즘 공부 (177)
        • 그래프 이론 (0)
        • 다익스트라 (4)
        • 위상정렬 (3)
        • 신장트리-크루스칼 알고리즘 (4)
        • 플로이드 워셜 (3)
        • 이진탐색 (9)
        • 백트래킹 (11)
        • 부르드포스 (9)
        • 다이나믹 프로그래밍 (20)
        • BFS & DFS (24)
        • 그리디 (6)
        • 구현 (15)
        • 정렬 (3)
        • 기타 (62)
        • 수학? (1)
      • 코딩 (173)
        • 파이썬(python) (15)
        • c언어 (13)
        • 프로그래머스 lv1 (46)
        • 프로그래머스 lv2 (41)
        • 백준 - c++ (49)
        • Softeer (9)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    n진법 변환
    인접리스트
    BFS
    프로그래머스
    캘리브레이션
    C언어 기초
    큐
    정렬
    코딩문제
    if문
    코딩기초스킬
    삽입 정렬
    스택
    그리디
    코딩테스트
    순차 탐색
    DFS
    소수찾기
    선택정렬
    c언어
    인접행렬
    이미지처리
    코딩기초
    다이나믹 프로그래밍
    자료구조
    알고리즘
    백준
    에라토슽네스의 체
    왜곡보정
    코딩
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
코딩 코딩 코오딩
4. 다양한 변수 선형 회기
상단으로

티스토리툴바