결정(값)
- 레이블, 클래스, 타겟(값)
- 지도 학습 시 데이터의 학습을 위해 주어지는 정답 데이터
- 지도 학습 중 분류의 경우 이 결정값을 레이블 또는 클래스로 지칭한다.
Feature
- 피처, 속성
- 데이터 셋의 일반 속성
- 타겟값을 제외한 나머지 속성을 모두 피처로 지칭한다
지도학습
Classification(분류)
- 대표적인 지도학습(Supervised Learning) 방법 중 하나
- 피처들의 패턴을 기반으로 레이블(답)을 학습한다
- 명확한 정답이 주어진 데이터를 먼저 학습한 뒤 미지의 정답을 예측하는 방식
- 학습 데이터 세트 : 학습을 위해 주어진 데이터 세트
- 테스트 데이터 세트: 머신러닝 모델의 예측 성능을 평가하기 위해 별도로 주어진 데이터 세트
교차 검증
- train set을 train set + validation set으로 분리한 뒤, validation set을 사용해 검증하는 방식
- train set으로 훈련, test set으로 검증하는 방식은
- 고정된 test set으로만 계속 검증을 하다보면 해당 test set에만 적합한 모델로 발전 할 수 있음
- 이런 모순을 해소하기 위해 교차 검증 방식을 사용
- Hold-out Cross-Validation, K-Fold Cross-Validation, Leave-p-Out Cross-Validation(LpOCV)