어제에 이어서 오늘도 머신러닝 강의를 반복해서 들었는데 도무지 이해가 잘 가지 않는다..
지금 상태로는 머신러닝에서 문제를 풀 때 방법이 회귀, 분류로 선택해서 문제를 풀고 경우에 따라 모두 사용하는 방법이 있다는 것을 배웠고, 선형 회귀는 가설을 세워 경사 하강법을 이용하여 손실 함수를 최소화 하면서 정답에 가까운 값을 도출하는 것이 목표라는 정도로 이해하고 있는 것 같다. 하지만 어떻게 사용하는지는 모르고 있는 상태라 내일부터는 사용법을 익히는 것에 초점을 맞춰 공부해야 할 것 같다.
🌈오늘 할 것
🌈오늘 배운 것
머신러닝에서 문제를 푸는 방법 : 회귀, 분류(경우에 따라 회귀와 분류 모두 사용할 때도 있다.)
머신러닝이 학습하는 방법 : 지도학습, 비지도 학습, 강화 학습
- 지도 학습 : 사람이 라벨링(정답)을 알려주면서 학습시키는 방법
- 비지도 학습 : 정답을 알려주지 않고 여러개의 입력 값을 주어 스스로 분류하고 학습하게 하는 방법
- 강화 학습 : 주어진 데이터 없이 실행과 오류를 반복하며 행동에 대해 보상하며 학습시키는 방법
선형회귀 : 모든 문제는 선형으로 풀 수 있다는 가정 하에 가설()을 세워
손실 함수(cost=mean squared error)를 최소화 하여 정답을 예측하는 방법이고, 입력 값이 여러 개 이면 다중 선형 회귀가 된다.
경사 하강법 : 선형 회귀 문제를 풀 때 손실 함수(cost or loss)를 최소화(Optimize)하는 것으로 Learning rate를 적용해 손실 함수의 최소 값을 찾는 방법
데이터 셋 : Traning set(학습 데이터 셋), Validationset(검증 데이터 셋), Test set(평가 데이터 셋)
- Traning set(학습 데이터 셋) : 머신 러닝을 학습시키는 용도로 전체 데이터 셋 중 80% 차지
- Validationset(검증 데이터 셋) : 정답을 가지고 학습한 데이터 셋을 검증하는 데이터 셋으로 전체 데이터 셋 중 20% 차지
- Test set(평가 데이터 셋) : 정답이 없는 데이터 셋으로 학습하고 검증한 데이터 셋을 최종적으로 평가하는 데이터 셋이다.
🌈내일 할 것