https://www.youtube.com/watch?v=JhvanJrl6oE&list=PLalb9l0_6WArHh18Plrn8uIGBUKalqsf-&index=4

t-test란?
- 모집단의 표준편차가 알려지지 않았을 때, 정규분포의 모집단에서 모은 샘플(표본)의 평균값에 대한 가설검정 방법





- 예를들어 평균 = 3, 표준편자= 1.58인 데이터가 있다고 해보자.




t-test를 바로 시작하지 못하는 이유
1. 정규분포- (z-test)

- 모집단의 경우는 z-test / 표본일 경우는 t-test를 한다.

- 정규분포는 평균과 표준편차만으로 규정됨
- 정규분포 아래 면적은 확률을 의미함 (면적의 합 =1)

- 총 1000명을 학생 중
영어점수가 82점~90점 사이의 학생 수를 구하고 싶다.
- 평균 = 82 , 표준편차 = 5 인 정규분포를 표준정규분포로 바꾸기

z-test


2. 양측(two-tail)/단측(one-tail) 검정





- 단측검정을 할지 양측검정을 할지는 연구자가 결정한다.
이제 t-test 를 해보자





- 파랑색 분포 : 표준정규분포 - N(0,1)
- 초록,빨강,노랑 : t분포 - t(자유도)
- 자유도 = df(degree of freedom) = n - 1
-> n(데이터)가 증가할수록 t분포가 표준정규분포에 가까워 진다(근사한다.)


-> 검색창에 't-table' 검색한 후


- 1 : two-tail / 2 : 0.05(5%확률) / 3 : critical value(c.v)1.984



- 왜 다를까? 원인이 뭐가있을까 고민해봐야 한다.
t-test의 종류
-
two-sample t-test(=independent samples t-test)

-
one-sample t-test

- Paired t-test
한개의 sample을 비포, 에프터 비교
