(머신러닝) 평가지표

샘2·2022년 10월 26일
0
post-thumbnail

회귀 모델의 평가지표

1.MAE

  • 모델의 예측값과 실제값의 차이를 절대값의 평균으로 나타낸 수치
  • 절대값을 취하기 때문에 가장 직관적으로 알 수 있는 지표이다.(해석이 용이)
  • 절대값을 취하기 때문에 모델이 실제보다 낮은 값으로 예측하는지 높은값으로 예측하는지 알 수 없다.

특징

1.손실함수가 오차와 비례하여 일정하게 증가하는 특징이 있음
2.Outlier에 강건하다
-> outliear가 있어도 최대한 잘 추정된 데이터들의 특성을 반영할 수 있기 때문에 통계적으로 중앙값과 연관이 깊다.

2.MSE

  • 모델의 예측값과 실제값의 차이를 제곱한 수치로 면적의 합이다.
  • 제곱을 하기 때문에 특이치에 만감하다.

    특징

    1. 오차가 커질수록 손실 함수값이 빠르게 증가하는 특징이 있음
    2. 통계학에서 많이 사용되며 회귀모델에서 이용된다.
    3. 단점으로 제곱으로 인해 숫자의 규모가 실제 데이터의 스케일에 비해 비대해질수 있음

3.RMSE

  • MSE에 루트를 씌워 사용한다
  • RMSE를 사용하면 오류 지표를 실제값과 유사한 단위로 다시 변환하여 해석을 쉽게한다.
  • 예측 대상의 크기에 영향을 바로 받는다.
  • MAE보다 특이치에 강하다

정리

-> 이상치를 무시하여 일반화할 필요가 있을 경우 MAE, 이상치도 고려하여 일반화가 필요할 경우 MSE를 사용한다. 그리고 RMSE는 MSE보다 이상치에 대해 상대적으로 둔감하여 모델 학습 시 이상치에 가중치를 부여하고자 한다면, MSE에 루트를 씌운 RMSE를 채택하는 것이 적절하다.
-> 이상치 여부에 따라 MAE->RMSE->MSE 순서로 정리!


References

https://jysden.medium.com/%EC%96%B8%EC%A0%9C-mse-mae-rmse%EB%A5%BC-%EC%82%AC%EC%9A%A9%ED%95%98%EB%8A%94%EA%B0%80-c473bd831c62
https://velog.io/@hyesoup/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-%ED%9A%8C%EA%B7%80-%EB%AA%A8%EB%8D%B8%EC%9D%98-%EC%84%B1%EB%8A%A5-%ED%8F%89%EA%B0%80-%EC%A7%80%ED%91%9C-MAE-MSE-RMSE-R-squred
https://heytech.tistory.com/362

profile
부지런한 개발자가 되고싶은

0개의 댓글