머신러닝 부분에서 배운 용어 정리
1. bias
- 오차의 편향이라고도 한다.
- 편향이 높다
= train data에서 타겟값과 오차가 크다
= Underfitting(과소적합 상태)이다.
2. variance
- 분산이 높다
= Overfitting 상태이다
= 테스트데이터에서 오차가 많아진다.
= 트레이닝데이터에서 오차가 0에 가깝다
3. overfitting
- 훈련데이터에만 특수한 성질을 과하게 학습해 일반화를 못 한 것.
- 테스트데이터에서 오차가 커지는 현상
4. Underfitting
- 훈련데이터에 과적합도 못하고
일반화 성질도 학습하지 못 한 상태
- 훈련/테스트 데이터로부터 오차가 크게 발생한다.
5. OLS line
6. 정규화 vs 표준화