모델 평가와 하이퍼파라미터 고르기

조권휘·2022년 7월 10일
0

Codeit_머신러닝

목록 보기
10/13

K겹 교차 검증(k-fold cross validation)

  • 모델의 성능을 더 정확하게 평가할 수 있는 방법 중 하나

  • 모델이 운좋게 딱 test set에서만 성능이 좋거나 안좋게 나올 수 있어서 k겹 교차 검증을 사용한다.

  • 전체 데이터를 k개의 같은 사이즈로 나눈 뒤, 1개의 데이터셋을 test set으로, 나머지를 training set으로 사용하며 이를 k번 반복한다. 이후 이 k개의 평균을 모델의 성능으로 보는 것

  • 일반적으로 k=5를 사용하지만, 더 작은 k를 사용해도 된다.

하이퍼 파라미터

  • 학습을 하기 전에 미리 정해줘야 하는 변수 또는 파라미터들
  • lasso 모델에서 alpha, max_iter과 같은 것들
  • 어떤 값을 넣어주느냐에 따라 성능에 큰 차이가 있을 수 있다.
  • 모델의 하이퍼 파라미터에 넣어보고 싶은 값을 정한 뒤, 모둔 후보 값의 조합으로 학습시켰을 때 가장 성능이 좋은 하이퍼 파라미터 조합을 고르는 것
hyper_parameter = {
	'alpha' : [0.01, 0.2, 1, 10],
    'max_iter' : [1000, 2000, 3000, 4000, 5000]
    }

본 포스트는 코드잇 강의를 공부하며 정리한 내용입니다! 자세한 설명은 "코드잇 머신러닝 강의를 참고해주세요!

+) 코드잇 강의 바로가기

profile
안녕하세요 :) Data/AI 공부 중인 한국외대 컴퓨터공학부 조권휘입니다.

0개의 댓글