[통계방법론] #1. 통계적추론 개요

허상범·2021년 7월 23일
0

Statistics

목록 보기
2/7
post-thumbnail
  • Date : 2021/07/23 금요일
  • 목표 : 확률론 이후 이어지는 통계방법론 전범위의 논리를 체계적으로, 그리고 흐름에 맞게 이해한다.

원문 : 비전공자를 위한 통계방법론 (양혁승)


제 3장. 추리통계 (통계적추론)

제 1절. 통계적 추론의 기본 개념

1. 통계적 추론 (Statiscal Inference)

모집단에서 추출한 표본으로부터 얻은 자료에 근거하여 모집단에 대한 특성을 추정하는 과정을 통계적 추론이라고 함 (Statiscal Inference) => 추리 통계, 통계방법론, 통계적 추정 등 다양하게 번역되니 영어로 기억하는게 좋음.

2.모집단 모수와 표본통계량

  • 모집단 모수 : 모집단의 어떤 특성을 대표하는 값으로, 연구자가 관심을 가지고 추정하고자 하는 값임.
  • 표본통계량 : 모집단의 모수를 추정하기 위해, 이에 대응되는 표본 데이터의 통계량을 말함
    ex) Q. 청소년들의 첫 이성교제 나이는 평균적으로 몇 살 정도일까? => 전수조사(Census)를 하는 것은 일반적으로 불가능하기 때문에 모집단으로부터 N개의 표본을 추출하여 그 표본에 속한 청소년들을 대상으로 모수의 값을 추정해내는 것.
  • 통계적 추론이란 표본통계량에 근거하여 모집단 모수를 추정하는 과정을 말함

  • Statiscal inference is a scientific process of estimating a certain parameter of population, mainly leveraging sample statistics from samples.

2-1. 주요 모수의 유형

  • 모집단의 평균 (모평균)
  • 모집단의 비율
  • 두 모집단 간 평균(or 비율)의 차이
  • 두 모집단 분산의 비율
  • 두 모집단 내 두 변수간 상관계수
  • 모집단 회귀계수
  • etc

2-2. 주요 모집단 모수와 각각에 상응하는 표본 통계량

한편, 추리통계에서는 모집단과 표본 사이의 차이를 명확하게 구분함으로써 혼동을 줄이는데, 통상 모집단 모수와 표본통계량을 표기법으로도 구분한다. (아래 [표3.1.1] 참고)

정리) 모수 & 표본통계량의 개념 및 차이

모집단 모수(population parameter)란 연구자가 관심을 갖고 추정하려는 모집단의 특정 통계량을 가리키며, 표본통계량(sample statistics)이란 모집단 모수를 추정하기 위해 사용하는, 모수에 대응되는 표본의 통계량을 가리킨다.

예컨대, 전체 유권자들의 A후보에 대한 지지율이 추정하려는 모집단 모수라면, 일정 수의 유권자들로 구성된 표본에서 얻은 A후보에 대한 지지율은 그 모수에 대응되는 표본 통계량이 된다.

3. 확률변수 (Random Variable)

3-1. 변수 vs 확률변수

1) 변수(variable)

변수란 관심대상 개체들의 일정한 특성으로, 통상 연구자가 연구 차원에서 자신이 관심을 갖는 사항을 변수로 설정한다.

예컨대, 우리나라 청소년 이성교제기간이 어떠한지 연구자가 관심을 갖고 있다면 이경우 개별 청소년들이 경험한 "이성교제기간"이 하나의 변수가 된다.

2) 확률변수(random variable)

확률변수는 매우 중요한 개념으로, 정의역으로서의 Sample Space와 치역으로서의 확률값을 맵핑하는 "함수"임을 명확히 인지해야 한다. 이 부분은 Harvard Statistics 110의 확률론 부분을 참고 및 정확히 이해하고 넘어가야 한다.

그리고 이 때 이산형 확률변수라면 개별 확률값의 분포를 그래프로 나타낸 것을 PMF(Probability Mass Function)이라 하고, 연속형 확률변수라면 PDF(Probability Density Function)이라 한다.

한편, PMF, PDF를 각각 특정 영역으로 나누어서 합치는(시그마, 적분) 역할을 하는 함수는 누적분포함수(CDF : Cumulative Distribution Function)이라 한다. 이 부분은 확률론 과정에서 더 자세히 공부하면 된다.

cf) Quantitative Investment의 대표격인 Factor-driven Investment에서의 Factor 역시 확률 변수를 나타냄.

profile
Engineering & Science, Since 2021 | Finance, Backend, Data

0개의 댓글