다양한 변수가 무엇이냐? 예시를 들어보면
y = w1*x1 + w2*x2 + w3*x3 와 같이 데이터에 들어오는 변수가 다양하다는 뜻이다.
딥러닝에는 다양한 변수가 존재할 수 있으므로 이러한 변수에 맞게 가중치 값 바이어스 값도 정해야한다.
머신 러닝에 필요한 것이 뭔지 다시 리마인드 해보자
가설값, 비용(손실)함수, 경사하강법
우리는 이 3가지를 우선 알고 있어야 한다. 그래야 머신러닝을 할 수 있다.
그러면 예시를 보고 이해를 해보자
이렇게 표현을 할 수 있다. 근데 여기서 왜? b(bias) 값은 하나지?
라는 의문이 생길 수 있다. 특별한 이유는 없다. 그냥 b값은 그냥 하나 주는 것이다. 크게 의미를 둘 필요 없다.
w(weight, 가중치)는 가중치라는 이름이 있듯이 데이터 값에 영향을 주는 값이므로 각각의 데이터에 맞는 값이 정해지지만 그냥 바이어스 값은 하나로 뭉뚱그려 생각한다고 생각하는 것이 편하다.
하지만 이제 한가지를 여기에 더 추가를 해보겠다.
x1, x2, x3 -------- xn 이라는 값이 많고 이러한 데이터의 수가 증가하게 된다면 우리는 수식으로 표현하기에 많이 불편해진다. 우리는 이런 계산을 편하게 표시하기 위해 배운 것이 행렬이다. 우리는 고등학교 시절에 행렬이라는 연산을 왜 배울까? 라고 의문을 가졌지만 딥러닝에서 행렬은 아주 강력한 힘을 나타 낼 수 있다.
참고로 우리가 말하는 x1, x2, x2 ---- xn 같은 데이터를 많은 사람들은 feature(특징) 값이라고도 많이 말하니 알고 있어두면 좋다. 머신러닝에서는 다양한 용어를 사용하는 사람이 많은데 꼭! 알고 있어야 한다. 무슨 학문이든 의사 소통이 중요한 만큼 그 학문에서 사용되는 용어를 알고 있어야한다는 것이 개인적으로 중요하다고 생각한다.
사실 내가 사용하는 용어도 사람들이 헷갈려 할수 있다는 것도 문제이다ㅋㅋㅋ 그리고 틀린 부분있으면 댓글 달아주시면 감사하겠습니다.
나는 이해했지만 만약에 읽어보고 의문이 생기는 부분이 있는 분들은 댓글을 남겨주세요!
여기서 말하는 instance (인스턴스)는 데이터의 수 예를들어 철수의 데이터, 영희의 데이터, 민수의 데이터와 같이 각가의 데이터를 instance라고 한다. 여기서 인스턴스는 3개이다.
우리는 이렇게 다양한 변수가 있을 때 딥러닝은 어떻게 처리할까?
라는 것을 이번 장에서 알아보았다. 그리고 w의 모양은 어떤 모양일까 라는 것을 데이터의 형태와 라벨의 형태로 유추가 가능하다.
끝
'AI > 머신러닝(딥러닝) 정리' 카테고리의 다른 글
5-2. Logistic (regression) classification: cost function & gradient decent (0) | 2022.05.01 |
---|---|
5-1. Logistic (regression) classification (0) | 2022.04.30 |
3. 어떻게 cost(loss) 비용, 손실을 작게 만들까 (0) | 2022.04.30 |
2. Linear Regression (선형 회기) (0) | 2022.04.29 |
1. 머신 러닝 기초 (0) | 2022.04.29 |