추정/가설검정에 관하여

youngjae-Kim·2022년 7월 26일
0

ADsP

목록 보기
3/5

추정

추정은 크게 2가지로 나눈다

  • 점추정

  • 구간추정

1. 점추정

  • 모수가 특정한 값일 것이라고 추정하는 것

  • 표본의 평균 중위수, 최빈값 등을 사용 -> 표본의 값을 사용

점추정량의 조건

    1. 불편성: 추정량 기댓값은 모집단의 모수와 차이가 없다
    1. 효율성: 분산이 작을수록 좋다
    1. 일치성: 표본 크기가 커지면, 추정량이 모수와 거의 같아진다
    1. 충족성: 추정량은 모수에 대하여 모든 정보를 제공한다

2. 구간추정

  • 모수가 특정한 구간에 있을 것이라고 추정

  • 모분산 σ2\sigma^2 을 알고 있는지의 유무에 따라
    알려진 경우 -> σ\sigma 사용
    알려져 있지 않은 경우 -> SS (표본 분산) 사용


가설검정

귀무가설 (H0H_0)

  • 비교하는 값과 차이가 없다, 동일하다, 유효하지 않다 등을 기본 개념으로 하는 가설

대립가설 (H1H_1)

  • 뚜렷한 증거가 있을 때 주장하는 가설

유의 수준

  • 귀무가설을 기각하게 되는 확률의 크기

  • 귀무가설이 옳은데도 이를 기각하는 확률의 크기
    -> 1종 오류를 허용하는 확률

난 이걸 진짜 개념을 공부할 때 만큼은 완벽하게 이해했다고 생각했지만 (다시 보면 까먹고 돌아서면 까먹어서..)

예를 들어보자!!

예시는 이 블로그의 예시를 참고 하였다.

장꾸는 제약회사에서 일을 하고있다. 탈모 치료약을 개발하였는데 효과가 좋은지 검정을 하고 싶다. 임상시험을 위해서 환자 100명을 모집하였고 약을 투여해서 전과후를 측정하였다. 이때의 귀무가설은 다음과 같습니다.

H0H_0 : 투약전과 후의 머리카락 갯수는 같다(차이가 없다)

귀무가설이 채택되면 회사는 망합니다. 귀무가설은 우리가 거짓으로 만들고 싶은 가설입니다.

대립가설은 귀무가설에 반대되는 가설입니다. 이 경우는 단순히 다르다가 아니라 부등호가 붙어야 합니다.

H1H_1 : 투약 후가 전보다 머리카락의 수가 많다!(차이가 난다!)

즉, 대립가설은 우리가 주장하는 가설입니다. 우리는 귀무가설을 기각하고 대립가설을 채택하고 싶음

하지만 이때 총 4가지의 상황이 발생할 수 있습니다.

  1. 귀무가설이 참이고 참으로 판별 -> (옳은 결정)

2. 귀무가설이 참인데 거짓으로 판별(1종 오류) -> (오류)

  1. 귀무가설이 거짓인데 참으로 판별(2종 오류) -> (오류)

  2. 귀무가설이 거짓인데 거짓으로 판별 -> (옳은 결정)

1종오류와 2종오류를 예제에 적용해보자

1종오류 : 탈모를 치료하는 약이 실제로 효과가 없는데 있다고 판별함

2종오류 : 탈모를 치료하는 약이 실제로 효과가 있는데 효과가 없다고 판별함

포인트는 더 심각한 상황을 판단을 해야합니다!!
2종오류의 결과는 제약회사의 개발 비용을 날리게 됩니다. 이것도 충분히 심각한 상황이긴합니다만 1종오류의 결과로 수많은 탈모인들이 탈모약을 구매하고 복용하였지만 실제로는 효과가 없는 상황입니다. 그리고 이 복용으로 인해 다른 질병이 발생할 수 있는 상황입니다.

그래서 1종오류를 통제하는 것입니다. 이를 통제하기 위해 p-value라는 유의수준을 사용합니다.


추가적으로 내용을 수정해야한다면 바로 고치겠습니다. 조금 더 좋은 예제가 있다면 알려주세요..!
많은 도움이 될 것 같습니다. 감사합니다.


모수/비모수 검정에 대해서

모수적 검정

  • 모집단의 분포에 대한 가정

  • 검정 방법: 관측된 자료를 이용 (표본 평균, 표본 분산)

비모수적 검정

  • 관측 자료가 특정 분포를 따른다고 가정할 수 없을 때

  • 자료의 수가 많지 않거나 서열관계를 나타내는 경우 이용

  • 검정 방법: 관측값들의 순위나 두 관측값 사이의 부호 등을 활용

profile
영원히 남는 기록, 재밌게 쓰자 :)

0개의 댓글