8장.단일 모평균의 추론(Inferences on a Population Mean) - 응용통계학

이찬·2023년 6월 10일
0
post-thumbnail
  • 특정 모집단으로부터 추출한 연속형 관측치를 대상으로 단일 표본 분석을 위한 확률 이론과 추정 방법들이 이 장에서 설명된다.
  • 변수의 척도가 범주형인지 연속형인지에 따라 데이터를 분석하는 방법이 다른데, 가설의 독립변수가 범주형이고 종속변수가 연속형일 때 사용할 수 있는 검정 방법은 t-test이다.
  • t-test는 두 개의 표본 평균 간의 차이를 검정한다. 독립 변수는 성별 또는 나이와 같은 범주형 데이터이고 종속변수는 평균을 산출할 수 있는 연속형 데이터이다.

개념 및 용어 정리

- 모집단(Population)이란?

  • 통계학에서 관심의 대상, 조사의 대상이 되는 모든 개체 값의 집합
  • 연구자가 알고 싶어하는 대상 또는 효과의 전체

- 모수(Population Parameter)란?

  • 모집단을 조사하여 얻을 수 있는 통계적인 특성치
  • 모집단 분포의 특성을 규정짓는 척도
  • 모평균, 모분산, 모비율, 모표준편차 등을 일컫는 말
  • 일반적으로 모수는 알려져 있지 않은 미지의 상수로 취급되며 통계적 추론을 통해 모수를 구할 수 있다.

- 표본(sample)이란?
조사대상이 되는 전체 모집단에 대하여 샘플링을 통해 얻어지는 결과 값으로 모집단의 부분집합

  • sampling : 일반적으로 전수검사를 하기 어려워 모집단에서 무작위로 추출하여 검사를 진행

=> 우리는 모집단을 완전히 파악할 수 없다. 또한, 모집단이 어떻게 생겼는지, 즉 모집단의 분포가 어떻게 되어 있는 지 정확하게 알 수가 없다. 그래서 표본을 측정 또는 관찰하여 연구자가 알고 싶어 하는 모집단을 추정하게 된다.

8.1 신뢰구간 Confidence Intervals

신뢰구간(Confidence Interval)

점 추정치가 아닌 그 모수가 존재할 것 같은 구간을 정하는 것으로 신뢰수준과 연관이 있다.

신뢰수준(Confidence Level)

신뢰수준은 실제로 모수가 그 구간 안에 존재할 확률을 의미하며 90%, 95%, 99%가 있다.

1-a로 사용하게 되면 a = 0.1, 0.0.5, 0.01의 유의수준을 보통 사용한다.

t-Intervals (t-구간)

t-구간 방법을 사용하기 위해서는 표본 평균이 정규분포를 따라야 한다.

정규분포를 따르지 않더라도 표본이 30 이상이라면 CLT(중심극한정리)에 의해 정규분포로 근사할 수 있다.

따라서 표본이 작으면 정확하게 정규분포를 따르지 않기 때문에 CLT 적용이 불가능하다.

하지만 그렇더라도 t-구간 계산 시 데이터가 정규분포랑 너무 큰 차이가 나지 않는다면 의미 있는 신뢰구간 가능

8.2 가설 검정

profile
Kyunghee univ. IE 21

0개의 댓글