20220927

Johnny Lee·2022년 9월 27일
0

일상

목록 보기
12/31

활률과 통계 수업 정리

2. 전수조사 대 부분조사

1) 전수조사(census)

- 자료수집대상 전체를 관찰하는 방법
- 이상적 방법 예)인구조사
- 조사시간, 비용 그리고 물리적 가능성 면에서 현실적으로 실행 불가능
- 전수조사 시 기 조사한 현상이 소멸 가능
- 비표본오차(non-sampling error) 발생 가능 (pp 296~297) 
- 조사대상의 파괴(destruction of object)수빈 시 적용 불가

조사대상 현상이 무엇인가와 누구를 대상으로 조사하느냐에 따라 전수조사 가능/바람직할 수도 있음
예) 해당자가 극소수인 희귀한 질병 연구
2) 표본조사
- 자료수집대상의 일부만을 관찰하고도 전체 자료수집대상에서 작동중인 현상간의 관계설명 가능 -> 통계학의 도움 필요
- 모집단
○ 관심 있는 현상을 관찰할 수 있는 자료수집대상 전체
- 표본
○ 모집단의 일부
- 전수조사
○ 모집단을 대상으로 조사하는 것
- 표본조사
○ 표본(sample)을 대상으로 조사하는 것
-> 일반적으로 전수조사보다는 표본조사를 압도적으로 많이 사용
-> 전체 연구대상 중 일부를 '어떻게 추출(sampling)하는가에 따라서
표본조사의 대표성(representativeness) 확보 가능

  1. 표본추출
    1) 표본추출의 논리
    ○ 표본추출/표짐
    § 전체 자료수집대상에서 일부를 선정하는 것

    • 일부를 조사한 결과가 전체를 대표하기 위해서는 "모집단의 모든 구성원이 표본에 속할 가능성이 동일한 경우에 그 표본은 모집단을 대표할 것"이란 논리를 충실히 따라야 함
      샘플에 들어갈 확률이 이상적으로 맞다.

    2) 표본추출 절차

    (1) 모집단(population)결정

    • 요소(element)
      ○ 사회과학 현상을 관찰할 수 있는 각 자료수집대상
      ○ 정보가 수집된느 단위(표본조사단위)
      ○ 분석의 기초(분석단위와 동일 개념)가 되는 단위
    • 모집단
      ○ 연구현상을 관찰할 수 있는 모든 자료수집대상의 집합체

    (2) 표본프레임(sampling frame)선정

    • 모집단을 구성하는 요소의 목록(list) 예) 한양대 대학생 학생부 혹은 표본프레임

    (3) 표본추출방법 결정(추후에 배움)

    • 연구목적에 적합한 구체적인 표본추출방법을 결정
    • 확률표본추출과 비확률표본추출을 결함해서 사용 가능
### (4) 표본크기(sample size) 결정 
- 일반적으로 표본의 수가 클수록 정확한 결과 도출
- 실제로 표본조사대상의 크기는 조사의 목표 및 비용 등에 의존

일반적으로 오차가 적은 조사를 희망할수록 표본의 크기 증가

(5) 표본추출

  • 실제 표본 추출

표본추출방법:

(1) 확률표본추출(probability sampling)
- 모집단에 속한 모든 구성요소가 표본에 추출될 확률이 동일한 조건에서 표본을 추출하는 것
- <장 점> 매우 정확환 결과 제공//일반화 가능
- <단점> 비용 시간
단순무작위표본추출(simple random rampling)
- 확률표본추출(probability sampling)의 정신을 가장 순수하게 구현하는 표본 추출
- 모집단을 구성하는 모든 구성요서에 고유의 번호를 부여하고 난수표(random number table)를 이용해서 무작위 숫자, 즉 난수(random number)를 선택하고 이 숫자에 대응하는 응답자를 표본으로 선택
단순무작위표본추출 방법은 실제로 그리 많이 사용되지 않음
1) 모집단 구성원에 수를 부여하는 것이 현실적으로 어려움
2) 다른 확률표본추출방법에 비해 표본오차가 상재거으로 더 클 수 있다는 점.

체계적 표본추출(systematic sampling)
- 목록에 등록된 매 k번쨰 요소가 체계적으로 선택되어 표본에 선택되는 방법(표본프레임이 체계적으로 있다)
- 표본추출간격(sampling interval), 표본추출비율(sample ratio), 요소들간에 '주기성(periodicity)'존재여부
Ex) 만약 10000명에게 설문지를 돌려 1000명의 표본을 구했다면, 표본추출간격: 10, 표본추출비용: 1/10, 주기성 있음. 체계적임

층화표본추출(stratified sampling) pp268-269
- 표본오차를 더욱 더 감소시켜서 표본의 대표성을 제고할 수 있는 표본추출방법
- 전체 모집단에서 직접 표본을 추출하는 대신에, 전체 모집단을 각자 동질적인 하위집단으로 일단 구분하고 각 하위집단에서 적절한 수의 요소를 추출하는 방법
층화(stratification:동질적인 하위집단으로의 구분)를 결정하는 변수의 선택에 주의

표본오차(sampling error) 포본오차=표본통계량-모수
표본오차란, 모집단의 일부인 표본에서 얻은 자료를 통해 모집단 전체의 특성을 추론할 때 생기는 오차를 말한다. 우리가 흔히 접하는 '95±3%'는 같은 조사를 100번 시행했다고 했을 시, 95번의 조사는 오차가 ±3% 내에 있다는 이야기이다.
- 표본이 모집단을 대표하지 못하는 정도: 결과 유용성 낮아짐
- 두 요인에 의해 영향 받음(s/ √n)
1)표본크기가 클수록 표본오차가 줄어들고,
2) 동질적인 모집단은 이질적인 모집단보다 작은 표본오차를 가진 표본을 생산
-> 층화표본추출은 두 번째 요인에 기초
군집표본추출(cluster sampling)
- 표본프레임이 없는 모집단에 대한 표본추출이 필요한 경우도 있게 됨
- -> 이러한 경우 먼저 각 요소들의 집단인 군집을 파학/추출한 다음, 각 군집 내에서 요소를 추출하는 방법
예) 대한민국 불교 기독교 신도에 대한 조사
- 전체적인 표본의 대표성은 상대적으로 떨어지게 됨
- 군집표본추출 시 표본오차를 줄일 수 있는 일반적인 규칙: 각 군집 내에서 추출되는 요소들의 수는 줄이고, 추춣할 순집의 수를 느리는 것.

(2)비확률표본추출(non-probability sampling)

  • 구성요소가 표본에 추출될 확률이 동일하지 않은 조건에서 표본을 추출하는것
    확률표본추출이 불가능한 상황에서 수행 //불가능한것 까지는 아니고 빨리 진행되는 상황 혹은 기존 연구가 없기 때문에 TEST 해보자는 마인드로 함.

  • <장/단점>확률표본추출의 반대/조사결과의 일반화가 어려움

편의 표본추출(convenience sampling)
- 연구자가 접근 가능한 대상자들을 표본으로 선정
- 모집단의 특성에 대한 고려 없이 표본을 ㅜ출
- 예) 스타벅스 커피의 brand 확장
장점: 시행이 쉽고 저 비용
단접: 연구결과의 일반화가 어려움

판단표본추출(judgment sampling)/유의표본추출(purposive sampling)
- 모집단에 대한 지식과 연구목적에 기초해서 표본을 추출
- 모집단의 특성에 대한 사전 지식은 있지만 모집단에 실질적으로 접근하기 힘들거나 모집단으로부터 확률표본추출이 힘들경우, 연구자가 알고있는 모집단의 특징을 가진 소규모 집단을 대상으로 표본을 구성하는 방법
예) 병원의 서비스실패(service failure)와 서비스 회복(service recovery)간의 관계연구

할당표본추출(quota sampling)
- 모집단의 특성이 적절히 반영되도록 모집단 내의 각 집단의 특성에 비례해서 표본을 추출하는 방법
- 연구에서 가장 중요한 변수를 기준으로 할당.

눈덩이표본추출(snowball sampling)->우연표본추출(accidnetal sampling)
- 특정 모집단의 구성원들을 찾아내기 어려운 경우에 사용되는 표본추출방법
예) 불법체류자에 대한 연구 (노숙자, 불법체류자)
(모집단의 대표성면에서는 많은 문제가 있어서 탐색적 연구에서 주로 사용되는 방법) //대표성에서 많이 떨어지지만, 해야될 필요가 있음

profile
You can always be better

0개의 댓글