1. 가설검정
가설 검정 = 가설(Hypothesis) + 검정(Testing)
1-1. 귀무가설, 대립가설
- 주어진 사실이나 조사하려는 사실에 대한 주장 또는 추측
- 통계학에서는 모수를 추정할 때 모수가 어떠하다는 증명하고 싶은 주장 또는 추측
- 귀무가설(Null hypothesis, H0)
- 기존의 사실(아무것도 없다, 의미가 없다)
- 대립가설과 반대되는 가설
- 연구하고자 하는 가설의 반대 가설로 연구 목적이 아님
- 예) H0: 코로나 백신이 효과가 없다, H0: μ = 0
- 대립가설(Alternative hypothesis: H1)
- 주장하고 싶은 가설 또는 연구의 목적
- 예) H1: 코로나 백신이 효과가 있다, H1: μ ≠ 0 or μ ≥ 0
1-2. 오류, 검정통계량, 기각역
- 제1종 오류(type I error) : 귀무가설이 참이지만, 귀무가설을 기각하는 오류
- H0을 기각할 확률이 a라면, 채택할 확률은 1-a
- 유의수준(a) : 제1종 오류가 발생할 확률의 최대 허용 한계
- 제2종 오류(type II error) : 귀무가설이 거짓이지만, 귀무가설을 채택하는 오류
- 검정통계량 : 귀무가설이 참이라는 가정하에 얻은 통계량
- 검정 결과 대립가설을 선택하게 되면 귀무가설을 기각
- 검정 결과 귀무가설을 선택하게 되면 귀무가설을 기각하지 못한다고 표현
- P-value : 귀무가설이 참일 확률
- 0~1사이의 표준화된 지표(확률값)
- 검정통계량을 얼마나 지지하는지 나타내는 확률
- 기각역(reject region) : 귀무가설을 기각시키는 검정통계량의 관측값 영역
1-3. 가설검정 절차
가설 수립 ➡ 유의수준(a) 결정 ➡ 기각역 설정 ➡ 검정통계량 계산 ➡ 의사결정
1-4. 양측검정, 단측검정
2. 단일 표본에 대한 가설검정
2-1. 모평균 가설검정 : 모분산을 알 때(대표본)
예) 커피의 카페인 함량이 140mg이라고 표기되어 있다. 수치가 정확한지 확인하고 싶다. 100개의 제품을 대상으로 카페인 함량을 측정한 결과 평균 138, 표준편차 15로 확인되었다. 유의수준 0.05에서 가설 검정하면?
2-2. 모평균 가설검정 : 모분산을 모를 때(소표본)
2-3. 모비율 가설검정
3. 두 개의 표본에 대한 가설검정
3-1. 모분산을 아는 경우(대표본)
예) 모집단1에서 추출한 표본의 평균이 35, 분산이 8이고 n1 = 50, 모집단2에서 추출한 표본의 평균이 32, 분산이 6이고 n2 =80일 때 이고 L4이 80일 때 두 모집단의
평균이 서로 다르다고 할 수 있는지 유의 수준 0.05에서 검정하면?
3-2. 모분산을 모르는 경우(소표본)
예) 체중 감소 보조제의 성능을 비교하기 위해 A군과 B군으로 나눠서 약을 먹고 6개월 후 체중 변화를 측정했다. B약이 A약보다 체중 감소 효과가 더 좋다고 할 수 있는지 유의수준 0.05에서 검정하면?
H0을 기각 할 수 있다.
즉 B약의 체중 감소 효과가 A약의 효과보다 크다고 할 수 있다.
3-3. 대응 비교