[ 5차시 ] 인공지능의 성능 평가 및 개선 방법

leeda06·2023년 5월 15일

공학도서관 대회

AIFriendsSchool

목록 보기

5/32

머신러닝 개념 정리

모델

모델이란?

모델은 특정 유형의 규칙을 인식하도록 훈련된 파일입니다.

모델의 역할

모델은 데이터를 빠르게 학습하여 높은 정확도로 예측과 판단을 수행하는 역할을 합니다.

데이터 세트

데이터 세트란?

데이터 세트는 훈련을 위해 모아놓은 데이터의 집합을 말합니다.

데이터 세트 종류

트레이닝 세트: 모델을 훈련시키기 위해 사용되는 데이터 세트로, 가장 많이 활용됩니다.
테스트 세트: 훈련된 모델의 성능을 평가하기 위해 사용되는 데이터 세트입니다.

머신러닝 목표

머신러닝의 목표는 처음 보는 데이터에서도 잘 작동하는 일반화된 모델을 얻는 것입니다.

과대적합

과대적합이란?

과대적합은 모델이 훈련 데이터에 너무 적합하여 일반성이 떨어지는 상태를 말합니다.

과대적합 원인

과대적합은 데이터 세트가 충분하지 않을 때 발생할 수 있습니다.

교차검증

교차검증은 데이터를 여러 번 반복하여 모델의 학습을 검증하는 방법입니다.

과소적합

과소적합이란?

과소적합은 모델이 훈련 세트의 규칙을 충분히 학습하지 못해 테스트 세트에 대한 정확도가 낮은 상태를 말합니다.

오차(손실)

오차(손실)란?

오차(손실)는 실제 값과 모델이 예측한 값의 차이를 의미합니다.

오차(손실)의 중요성

오차가 작을수록 모델의 예측이 정확하다고 할 수 있습니다.

손실함수

손실함수란?

손실함수는 회귀모델의 오차를 계산하는 함수입니다.

손실함수 종류

평균 절대 오차(MAE): 실제 값과 예측 값의 차이의 절대값을 평균하여 계산합니다.
평균 제곱 오차(MSE): 실제 값과 예측 값의 차이를 제곱하여 평균을 계산합니다. 제곱을 함으로써 음수를 없애고, 값이 작을수록 더 좋습니다.

모델의 성능 평가 지표

오차행렬 (Confusion Matrix)

오차행렬은 긍정, 부정, 사실, 거짓 등 네 가지 경우의 수로 분류하여 표로 나타냅니다. 이를 통해 모델의 성능을 평가합니다.

정확도 (Accuracy)

정확도는 모델이 정확하게 예측한 비율을 나타냅니다.

정밀도 (Precision)

정밀도는 모델이 정답이라고 예측한 비율을 나타냅니다. 실제로 정답인 것 중에서도 정답을 예측한 비율을 의미합니다.

재현율 (Recall 또는 Sensitivity)

재현율은 실제로 정답인 것 중에서 모델이 정답을 맞춘 비율을 나타냅니다.

leeda06

웹솔루션과

이전 포스트

[ 4차시 ] 머신러닝(지도, 비지도, 강화)의 용어와 원리파악

다음 포스트