통계 - 가설검정 : 데이터 취업 스터디 노트 1/3

slocat·2024년 1월 3일
0

start-data

목록 보기
59/75

1. 가설검정

가설 검정 = 가설(Hypothesis) + 검정(Testing)

1-1. 귀무가설, 대립가설

  • 주어진 사실이나 조사하려는 사실에 대한 주장 또는 추측
  • 통계학에서는 모수를 추정할 때 모수가 어떠하다는 증명하고 싶은 주장 또는 추측
  • 귀무가설(Null hypothesis, H0)
    • 기존의 사실(아무것도 없다, 의미가 없다)
    • 대립가설과 반대되는 가설
    • 연구하고자 하는 가설의 반대 가설로 연구 목적이 아님
    • 예) H0: 코로나 백신이 효과가 없다, H0: μ = 0
  • 대립가설(Alternative hypothesis: H1)
    • 주장하고 싶은 가설 또는 연구의 목적
    • 예) H1: 코로나 백신이 효과가 있다, H1: μ ≠ 0 or μ ≥ 0

1-2. 오류, 검정통계량, 기각역

  • 제1종 오류(type I error) : 귀무가설이 참이지만, 귀무가설을 기각하는 오류
    • H0을 기각할 확률이 a라면, 채택할 확률은 1-a
    • 유의수준(a) : 제1종 오류가 발생할 확률의 최대 허용 한계
  • 제2종 오류(type II error) : 귀무가설이 거짓이지만, 귀무가설을 채택하는 오류
  • 검정통계량 : 귀무가설이 참이라는 가정하에 얻은 통계량
    • 검정 결과 대립가설을 선택하게 되면 귀무가설을 기각
    • 검정 결과 귀무가설을 선택하게 되면 귀무가설을 기각하지 못한다고 표현
  • P-value : 귀무가설이 참일 확률
    • 0~1사이의 표준화된 지표(확률값)
    • 검정통계량을 얼마나 지지하는지 나타내는 확률
  • 기각역(reject region) : 귀무가설을 기각시키는 검정통계량의 관측값 영역

1-3. 가설검정 절차

가설 수립 ➡ 유의수준(a) 결정 ➡ 기각역 설정 ➡ 검정통계량 계산 ➡ 의사결정

1-4. 양측검정, 단측검정

  • 양측검정(two-side test) : 대립가설이 "같지 않다/차이가 있다"처럼 양방향 주장

    • 예) A백신과 B백신의 코로나 면역력에는 차이가 있다.
    • 예) A팀과 B팀의 평균 연봉은 차이가 있다.
  • 단측검정(one-side test) : 대립가설이 "크다/작다"처럼 단방향 주장

    • 예) A제품의 수율이 B제품의 수율보다 크다.
    • 예) A팀의 평균 연봉이 B팀의 평균 연봉보다 크다.

2. 단일 표본에 대한 가설검정

2-1. 모평균 가설검정 : 모분산을 알 때(대표본)

예) 커피의 카페인 함량이 140mg이라고 표기되어 있다. 수치가 정확한지 확인하고 싶다. 100개의 제품을 대상으로 카페인 함량을 측정한 결과 평균 138, 표준편차 15로 확인되었다. 유의수준 0.05에서 가설 검정하면?

2-2. 모평균 가설검정 : 모분산을 모를 때(소표본)

2-3. 모비율 가설검정

3. 두 개의 표본에 대한 가설검정

3-1. 모분산을 아는 경우(대표본)

예) 모집단1에서 추출한 표본의 평균이 35, 분산이 8이고 n1 = 50, 모집단2에서 추출한 표본의 평균이 32, 분산이 6이고 n2 =80일 때 이고 L4이 80일 때 두 모집단의
평균이 서로 다르다고 할 수 있는지 유의 수준 0.05에서 검정하면?

3-2. 모분산을 모르는 경우(소표본)

예) 체중 감소 보조제의 성능을 비교하기 위해 A군과 B군으로 나눠서 약을 먹고 6개월 후 체중 변화를 측정했다. B약이 A약보다 체중 감소 효과가 더 좋다고 할 수 있는지 유의수준 0.05에서 검정하면?

H0을 기각 할 수 있다.
즉 B약의 체중 감소 효과가 A약의 효과보다 크다고 할 수 있다.

3-3. 대응 비교

0개의 댓글