강의 자료: K-mooc '통계학의 이해 I, II'
링크: http://www.kmooc.kr/courses/course-v1:SookmyungK+SM_sta_004k+2019_03SM_02/courseware/c39639d95669426a9464b4948fcc339b/1f67a74da4954e8cb4c5183cf74d199c/1?activate_block_id=block-v1%3ASookmyungK%2BSM_sta_004k%2B2019_03SM_02%2Btype%40vertical%2Bblock%4007a33e49977242ca9e06a9ffaee90ea7
- Summary : 통계학의 이해 I = 기술통계, 확률 등 / 통계학의 이해 II = 통계적 추론
통계학이란
: 관심 또는 연구의 대상인 모집단의 특성을 파악하기 위해
- 모집단부터 일부의 자료(표본)를 수집하고,
- 수집된 표본을 정리, 요약, 분석하여 표본의 특성을 파악한 후,
- 표본의 특성을 이용하여 모집단의 특성에 대해 추론하는 원리와 방법을 제공하는 학문
통계학적 처리과정
- 관심 또는 연구 대상(문제, 주제, 가설) 설정
- 실험을 통해 자료를 수집
- 자료를 정리, 요약, 분석하여 자료의 특성을 파악
- 자료의 특성을 이용하여 연구 대상에 대해 추론
모집단 (population)
: 연구대상이 되는 모든 개체의 집합
예) 19대 대통령 선거 선거인 명부 유권자수는 42,432,413명
- 실제로 관심을 가지는 것은 대상 자체보다는 그 대상의 속성에 관심을 가지기 대문에 전체 대상의 속성이 모집단이 되기도 함.
예) 전체 임금의 수명, 전체 내시의 수명
- 대부분의 모집단은 매우 커 전체를 조사하기 힘듦
예) 대통령 선거에서 어떤 후보자의 지지율
- 모집단을 명확하게 정의할 수 있는 경우도 있지만 모호한 경우도 있음
예) “그냥도전 동전 돌리기”에서의 모집단은?
- 통계분석을 할 때 이런 문제를 심심치 않게 만나는데 이 경우 모집단을 동전 돌리기 실험을 무한히 많이 반복수행하여 결과를 모아 놓은 것으로 이해.
목표 모집단 (target population) ; 대상 모집단
: 개념적으로 규정한 조사 대상 전체
조사 모집단 (survey population)
: 실제로 표본을 추출하기 위해 규정한 조사 대상 전체
예) 경제활동 인구조사
- 목표 모집단: 군인 및 수감자 등을 제외한 대한민국 영토 내에 거주하는 15세 이상 모든 국민
- 조사모집단: 조사의 편의나 여건을 고려해 도서지역, 기술시설 및 특수시설 거주자는 조사 대상에서 제외
전수조사
: 모집단 전체를 대상으로 조사하는 경우
- 센서스(census)는 추정하다(to estimate)라는 뜻의 라틴어 “censere”에서 유래 되었으며 센서스, 공공치안, 국가재정 등의 일을 담당하던 고대로마 관료를 censor라고 함
표본 (Sample)
: 모집단으로부터 선택된 일부의 개체
예) 양세계보에 수록된 81명의 내시, "그냥도전 동전 돌리기"에서 나온 1000번의 동전 결과
- Q/P. 추출된 표본이 모집단 특성을 대표할 수 있는가?
예) 양세계보에 기록된 내시가 모두 특정 시기의 내시라고 한다면 그 시기의 정치, 사회적 상황과
의학기술에 영향을 받음 ⇨ 조선시대의 전체 내시를 대표한다고 보기 어려움
etc.
1948년 미국 대통령 선거 결과 예측에서 기존의 표본 조사법인 "할당 추출법"이 예측에 실패하자, "확률 추출법"으로 방향이 바뀌었다.