Evaluation Metrics for Classification

TaeWoo Lee / Kris·2021년 12월 24일

Code States [AI_09] Section2

목록 보기

7/12

정확도(Accuracy)는 전체 범주를 모두 바르게 맞춘 경우를 전체 수로 나눈 값
- $\large \frac{TP + TN}{Total}$
정밀도(Precision)는 Positive로 예측한 경우 중 올바르게 Positive를 맞춘 비율 즉 예측값이 얼마나 정확한가
- $\large \frac{TP}{TP + FP}$
재현율(Recall, Sensitivity)은 실제 Positive인 것 중 올바르게 Positive를 맞춘 것의 비율 즉 실제 정답을 얼마나 맞췄느냐
- $\large \frac{TP}{TP + FN}$
F1점수(F1 score)는 정밀도와 재현율의 조화평균(harmonic mean)
- $2\cdot\large\frac{precision\cdot recall}{precision + recall}$

특성상 정밀도 또는 재현율이 특별히 강조돼야 할 경우가 있는데 이때는 임계값을 조정해 정밀도 또는 재현율을 높일 수 있지만 정밀도와 재현율은 상호 보완적인 평가 지표이기 때문에 어느 한쪽을 높이면 다른 한쪽은 줄어들게 됨

Recall(재현율) = Sensitivity = $\mathrm {TPR} ={\frac {\mathrm {TP} }{\mathrm {P} }}={\frac {\mathrm {TP} }{\mathrm {TP} +\mathrm {FN} }}=1-\mathrm {FNR}$
- 1인 케이스에 대해 1로 바르게 예측하는 비율 (Sensitivity)
Fall-out(위양성률) = $\mathrm {FPR} ={\frac {\mathrm {FP} }{\mathrm {N} }}={\frac {\mathrm {FP} }{\mathrm {FP} +\mathrm {TN} }}=1-\mathrm {TNR(Specificity)}$
- 0인 케이스에 대해 1로 틀리게 예측하는 비율 (1-Specificity)
재현율은 최대화 하고 위양성률은 최소화 하는 임계값이 최적의 임계값
AUC 는 ROC curve의 아래 면적
- 1에 가까울수록 좋은 수치이고, 0.5에 가까울수록 학습이 제대로 이루어지지 않은 모델
추가 참조 사이트

일단 저지르자! 그리고 해결하자!