표본설계 및 표본추출 과정에서 모집단의 구성과 다른 표본이 얻어질 수 있는 문제를 가중치 조정을 통해 해결하는 방법 => 가중치를 표본에 곱해서 해결 가능
가중치가 필요한 이유
- 모집단이 다른 특성을 가지는 부모집단들로 이루어진 경우, 부모집단의 구성비율과 표본의 구성비율이 다르면 전체 모집단에 대해 왜곡된 결과가 나올 수 있음
- 표본 추출설계에 충실히 반영해도 실제 표본 획득 과정에서 여러 문제가 발생
=> 가중치 적용 -> 한 표본이 몇 개를 대표하는지
기본 가중치
- 단순확률추출법: 각 표본에 대한 설계 가중치는 동일 w = N/n
- 계통추출법: 각 표본에 대한 설계 가중치 동일 w = N/n = k
- 층화확률추출법: 층의 크기와 해당 층에서의 표본크기에 따라 달라짐
- 집락추출: 집락의 크기와 해당 집락에서의 표본크기에 따라 달라짐
1. 추출확률에 따른 가중치 : W1
등확률 추출인 경우
- 표본으로 선택될 확률 = n/N
- 표본에서 차지하는 비중 = 1/n
=> 표본 한 명이 N/n명을 대표
등확률 추출이 아닌 경우
- 추출확률의 상이함에 따른 조정
- 설계 가중치, 표본추출 가중치, 기초 가중치
예) 설계 가중치 = 1/추출률
2. 무응답에 따른 가중치 : W2
- 대체표본이 없거나 일부 항목에 답을 하지 않은 경우
예) 응답 가중치 = 1/응답률
3. 사후층화를 위한 가중치: w3
- 가중 표본 분포가 어떤 특성에 대해 알려진 모집단 분포와 일치하도록 조정
예)
사후층화 가중치
- 남자의 가중치 = 45/60
- 여자의 가중치 = 55/40
최종 가중치(final weight): Wf = W1 x W2 x W3
W1 = 확률 추출에 따른 가중치, W2 = 무응답에 따른 가중치, W3 = 사후층화를 위한 가중치
- 응답한 수도권 남자: W = 800 x 10/6 x 45/60 = 1000
- 응답한 수도권 여자: W = 800 x 10/6 x 55/40 = 1833.3
- 응답한 지방 남자: W = 400 x 10/8 x 45/60 = 375
- 응답한 지방 여자: W = 400 x 10/8 x 55/40 = 687.5