ANOVA 분산분석 : 평균이 같은지 검정하는데 분산을 분석하는 이유

Oni·2024년 3월 2일
0

분산분석이 뭐야?

= ANOVA(Analysis of Variance)라고도 한다.

  • 여러 그룹 간의 평균이 통계적으로 유의미하게 다른지를 판단하기 위해 사용되는 방법

  • 그룹 간의 평균이 다른지를 확인하기 위해서는 그룹 내 분산과 그룹 간 분산을 비교.

    평균이 같은지 검정하는데 분산을 분석하는 이유는 집단간 평균값 자체만으로는 그룹 간 평균이 다른지를 판단할 수 없기 때문이다. '분산'을 활용해 분포(퍼진 정도)를 확인해준다.
    그럼 분산을 왜 그룹내 분산, 그룹 간 분산 2개나 구할까?
    하나만 알아서는 여러 그룹 간의 평균이 통계적으로 유의미하게 다른지를 판단할 수 없기 때문이다.
    다음 그림을 참고해보자.

    1번 집단 간 분산이 큰 경우, 3번 집단 내 분산이 작은 경우만 보면
    각 그룹간 겹치는 부분이 적다.
    그러나 2번 4번의 경우 와 같은 예외가 있기 때문에 집단 간 분산, 집단 내 2가지를 모두 고려해야 한다.


Reference

profile
데이터 분석/엔지니어링/ML에 관한 기록

0개의 댓글