[Adsp] 3-4. 기초통계 및 상관분석

Mini·2022년 8월 18일
0

ADsP

목록 보기
10/17

(1) T-검정

  • <1> 일 (단일) 표본 t-검정 (one smple t-test)
    • 가설 검증의 일종
    • 하나의 모집단의 평균 (n) 값을 특정값과 비교하는 경우 사용하는 통계적 분석 방법
  • <2> 일 (단일) 표본 단측 t-검정
    • 모수값이 '~보다 같다.', '~보다 작다.' -> 한쪽으로의 방향성을 갖는 경우 수행되는 검정 방법
    • 자유도는 표본의 개수보다 1만큼 적음.
    • p-value가 유의수준 0.05보다 작으면 귀무가설 기각
    • p-value가 유의수준 0.05보다 크면 귀무가설 채택 (기각할 수 없다)
  • <3> 단일 표본 양측 t-검정
    • 방향성을 갖지 않고 모수값이 '~이다', '~이 아니다.'와 같이 방향성이 없는 경우 수행되는 검정 방법
  • <4> 이(독립) 표본 t-검정
    • 가설검정 일종으로 서로 독립적인 두 개의 집단에 대하여 모수(모평균)의 값이 같은 값을 갖는지 통계적으로 검정하는 방법
    • 독립표본 t-검정
      • 독립 : 두 모집단에서 각각 추출된 두 표본이 서로 관계가 없다는 것을 의미
    • 두 모집단의 분산이 같음을 의미하는 등분산성을 만족해야 함. 그래서 등분산 검정을 먼저 수행해야 함
  • <5> 이 표본 단측 t-검정
    • 두 집단에 대하여 모수 비교를 할 때 '~이 ~보다 크다' 혹은 '~이 ~보다 작다'와 같이 두 집단 사이에 대소가 있는 경우 수행되는 검정 방식
  • <6> 대응 표본 t-검정
    • 동일한 대상에 대해 두 관측치가 있는 경우 이를 비교하여 차이가 있는지 검정할 때 사용
    • 주로 실험 전후의 효과를 비교하기 위해 사용

(2) 분산 분석(AVNOVA)

  • 세 개 이상의 모집단이 있을 경우 여러 집단 사이의 평균을 비교하는 검정 방법
  • 귀무가설 : H0 -> 모든 집단 간 평균은 같다.
  • 아래 세 가지 가정 사항 필요 (정규성, 등분산성, 독립성)
    • 정규성 : 각 집단의 표본들은 정규분포를 따라야 함
    • 등분산성 : 각 집단은 동일한 분산을 가져야 함
    • 독립성 : 각 집단은 서로에게 영향을 주지 않는다.
  • 독립 변수(그룹 변수) -> 범주형 데이터, 종속 변수 -> 연속형 데이터
  • 일원분산분석 -> 셋 이상의 집단 간 평균을 비교하는 상황에서 하나의 집단에 속하는 독립변수와 종속변수 모두 한 개 일때 사용
    * aov (데이터, 종속변수(연속형) ~그룹변수(범주형))
  • 이원분산분석 : 독립변수의 수가 두 개 이상일 때 사용
    • 독립변수 간 교호작용 (독립 변수끼리 서로 영향을 미치는 경우)이 ㅇ-> 반복 ㅇ / 없는 경우 x
    • 종속변수가 2개 이상 : 다변량분석 (다원분산분석)

(3) 교차 분석

  • 범주형 자료(명목, 서열) 간의 관계를 알아보고자 할 때 사용되는 분석 방법
  • 카이제곱 (X^2) 검정 통계량 이용
  • 적합도 검정, 독립성 검정, 동질성 검정에 사용

(4) 상관 분석

  • 두 변수 간의 선형적 관계가 존재하는지 알아보는 분석 방법
  • 상관계수 활용
  • 상관계수 : -1과 +1사이의 값, 공분산을 두 변수의 표준편차의 곱으로 나눈 값
    • +1에 가까움-> 강한 양의 상관관계 / -1에 가까움 -> 강한 음의 상관관계
    • 0에 가까움 -> 상관관계 존재 x
  • 귀무가설 : 두 변수는 아무 상관관계가 없다
  • 피어슨 상관분석 (선형적 상관관계) -> 등간척도, 비율척도 (연속형 변수)
  • 스피어만 상관분석 (비선형적) -> 서열척도

0개의 댓글