모델은 특정 유형의 규칙을 인식하도록 훈련된 파일입니다.
모델은 데이터를 빠르게 학습하여 높은 정확도로 예측과 판단을 수행하는 역할을 합니다.
데이터 세트는 훈련을 위해 모아놓은 데이터의 집합을 말합니다.
머신러닝의 목표는 처음 보는 데이터에서도 잘 작동하는 일반화된 모델을 얻는 것입니다.
과대적합은 모델이 훈련 데이터에 너무 적합하여 일반성이 떨어지는 상태를 말합니다.
과대적합은 데이터 세트가 충분하지 않을 때 발생할 수 있습니다.
교차검증은 데이터를 여러 번 반복하여 모델의 학습을 검증하는 방법입니다.
과소적합은 모델이 훈련 세트의 규칙을 충분히 학습하지 못해 테스트 세트에 대한 정확도가 낮은 상태를 말합니다.
오차(손실)는 실제 값과 모델이 예측한 값의 차이를 의미합니다.
오차가 작을수록 모델의 예측이 정확하다고 할 수 있습니다.
손실함수는 회귀모델의 오차를 계산하는 함수입니다.
오차행렬은 긍정, 부정, 사실, 거짓 등 네 가지 경우의 수로 분류하여 표로 나타냅니다. 이를 통해 모델의 성능을 평가합니다.
정확도는 모델이 정확하게 예측한 비율을 나타냅니다.
정밀도는 모델이 정답이라고 예측한 비율을 나타냅니다. 실제로 정답인 것 중에서도 정답을 예측한 비율을 의미합니다.
재현율은 실제로 정답인 것 중에서 모델이 정답을 맞춘 비율을 나타냅니다.