[통계] 통계학이란_3. 가중치

김고은·2022년 9월 21일
0

통계학

목록 보기
3/7

표본설계 및 표본추출 과정에서 모집단의 구성과 다른 표본이 얻어질 수 있는 문제를 가중치 조정을 통해 해결하는 방법 => 가중치를 표본에 곱해서 해결 가능

가중치가 필요한 이유

  • 모집단이 다른 특성을 가지는 부모집단들로 이루어진 경우, 부모집단의 구성비율과 표본의 구성비율이 다르면 전체 모집단에 대해 왜곡된 결과가 나올 수 있음
  • 표본 추출설계에 충실히 반영해도 실제 표본 획득 과정에서 여러 문제가 발생
    => 가중치 적용 -> 한 표본이 몇 개를 대표하는지

기본 가중치

  • 단순확률추출법: 각 표본에 대한 설계 가중치는 동일 w = N/n
  • 계통추출법: 각 표본에 대한 설계 가중치 동일 w = N/n = k
  • 층화확률추출법: 층의 크기와 해당 층에서의 표본크기에 따라 달라짐
  • 집락추출: 집락의 크기와 해당 집락에서의 표본크기에 따라 달라짐

1. 추출확률에 따른 가중치 : W1

등확률 추출인 경우

  • 표본으로 선택될 확률 = n/N
  • 표본에서 차지하는 비중 = 1/n
    => 표본 한 명이 N/n명을 대표

등확률 추출이 아닌 경우

  • 추출확률의 상이함에 따른 조정
  • 설계 가중치, 표본추출 가중치, 기초 가중치
    예) 설계 가중치 = 1/추출률

2. 무응답에 따른 가중치 : W2

  • 대체표본이 없거나 일부 항목에 답을 하지 않은 경우
    예) 응답 가중치 = 1/응답률

3. 사후층화를 위한 가중치: w3

  • 가중 표본 분포가 어떤 특성에 대해 알려진 모집단 분포와 일치하도록 조정

예)

사후층화 가중치

  • 남자의 가중치 = 45/60
  • 여자의 가중치 = 55/40

최종 가중치(final weight): Wf = W1 x W2 x W3

W1 = 확률 추출에 따른 가중치, W2 = 무응답에 따른 가중치, W3 = 사후층화를 위한 가중치

  • 응답한 수도권 남자: W = 800 x 10/6 x 45/60 = 1000
  • 응답한 수도권 여자: W = 800 x 10/6 x 55/40 = 1833.3
  • 응답한 지방 남자: W = 400 x 10/8 x 45/60 = 375
  • 응답한 지방 여자: W = 400 x 10/8 x 55/40 = 687.5
profile
veloger

0개의 댓글