모델의 성능을 더 정확하게 평가할 수 있는 방법 중 하나
모델이 운좋게 딱 test set에서만 성능이 좋거나 안좋게 나올 수 있어서 k겹 교차 검증을 사용한다.
전체 데이터를 k개의 같은 사이즈로 나눈 뒤, 1개의 데이터셋을 test set으로, 나머지를 training set으로 사용하며 이를 k번 반복한다. 이후 이 k개의 평균을 모델의 성능으로 보는 것
일반적으로 k=5를 사용하지만, 더 작은 k를 사용해도 된다.
hyper_parameter = {
'alpha' : [0.01, 0.2, 1, 10],
'max_iter' : [1000, 2000, 3000, 4000, 5000]
}
본 포스트는 코드잇 강의를 공부하며 정리한 내용입니다! 자세한 설명은 "코드잇 머신러닝 강의를 참고해주세요!
+) 코드잇 강의 바로가기