머신러닝 용어

adam2·2021년 8월 16일
0

결정(값)

  • 레이블, 클래스, 타겟(값)
  • 지도 학습 시 데이터의 학습을 위해 주어지는 정답 데이터
  • 지도 학습 중 분류의 경우 이 결정값을 레이블 또는 클래스로 지칭한다.

Feature

  • 피처, 속성
  • 데이터 셋의 일반 속성
  • 타겟값을 제외한 나머지 속성을 모두 피처로 지칭한다

지도학습

Classification(분류)

  • 대표적인 지도학습(Supervised Learning) 방법 중 하나
  • 피처들의 패턴을 기반으로 레이블(답)을 학습한다
  • 명확한 정답이 주어진 데이터를 먼저 학습한 뒤 미지의 정답을 예측하는 방식
  • 학습 데이터 세트 : 학습을 위해 주어진 데이터 세트
  • 테스트 데이터 세트: 머신러닝 모델의 예측 성능을 평가하기 위해 별도로 주어진 데이터 세트

교차 검증

  • train set을 train set + validation set으로 분리한 뒤, validation set을 사용해 검증하는 방식
    - train set으로 훈련, test set으로 검증하는 방식은
    - 고정된 test set으로만 계속 검증을 하다보면 해당 test set에만 적합한 모델로 발전 할 수 있음
    - 이런 모순을 해소하기 위해 교차 검증 방식을 사용
  • Hold-out Cross-Validation, K-Fold Cross-Validation, Leave-p-Out Cross-Validation(LpOCV)

0개의 댓글