πŸ“‹[Excel] 데이터 뢄석 (t-test, F-κ²€μ •)

thisk336Β·2023λ…„ 10μ›” 7일
0

Excel

λͺ©λ‘ 보기
7/11
post-thumbnail

t-testλž€?

  • t-testλž€ 두 집단(λ˜λŠ” ν•œ μ§‘λ‹¨μ˜ μ „/ν›„)의 평균에 ν†΅κ³„μ μœΌλ‘œ μœ μ˜λ―Έν•œ 차이가 μžˆλŠ”μ§€λ₯Ό κ²€μ •ν•˜λŠ” 방법이닀.
  • μ ν•©ν•œ t-test 방법을 μ„ νƒν•˜κΈ° μœ„ν•œ F κ²€μ • ν•„μš”ν•˜λ‹€.

    t-test의 μ‹œν–‰ 단계
    λ³€μˆ˜(집단) 선택 β†’ F-κ²€μ • β†’ t-test β†’ κ²°κ³Ό 해석

F-κ²€μ •μ΄λž€?

  • F-검정은 두 μ§‘λ‹¨μ˜ 뢄산에 ν†΅κ³„μ μœΌλ‘œ μœ μ˜λ―Έν•œ 차이가 μžˆλŠ”μ§€λ₯Ό κ²€μ •ν•˜λŠ” λ°©λ²•μœΌλ‘œ t-test μ‹€μ‹œ 전에 μ‹œν–‰ν•œλ‹€.
  • F-κ²€μ •μ˜ 귀무 가섀은 두 집단(λ˜λŠ” ν•œ μ§‘λ‹¨μ˜ μ „/ν›„)의 뢄산에 μœ μ˜λ―Έν•œ 차이가 μ—†λ‹€.둜 P-valueλ₯Ό ν™•μΈν•˜μ—¬ μœ μ˜μˆ˜μ€€λ³΄λ‹€ 클 λ•Œ 귀무가섀을 μ±„νƒν•œλ‹€.
  • P-valueκ°€ 0.05보닀 크면 두 μ§‘λ‹¨μ˜ 뢄산에 μœ μ˜λ―Έν•œ 차이가 μ—†κ³ , 0.05보닀 μž‘μœΌλ©΄ 두 μ§‘λ‹¨μ˜ 뢄산에 μœ μ˜λ―Έν•œ 차이가 μžˆλ‹€
  • 두 μ§‘λ‹¨μ˜ 뢄산에 μœ μ˜λ―Έν•œ 차이가 μ—†μœΌλ©΄ λ“±λΆ„μ‚° κ°€μ • t-testλ₯Ό, 두 μ§‘λ‹¨μ˜ 뢄산에 μœ μ˜λ―Έν•œ 차이가 있으면 이뢄산 κ°€μ • t-testλ₯Ό μ‹€μ‹œν•œλ‹€.

β˜…P-valueλž€?

  • 귀무 가섀이 λ§žλ‹€λŠ” μ „μ œ ν•˜μ—, ν‘œλ³Έμ—μ„œ μ‹€μ œλ‘œ κ΄€μΈ‘λœ ν†΅κ³„μΉ˜μ™€ 'κ°™κ±°λ‚˜ 더 극단적인' ν†΅κ³„μΉ˜κ°€ 관츑될 ν™•λ₯ μ„ λ§ν•œλ‹€. 즉, 뢄석을 톡해 얻은 κ²€μ • ν†΅κ³„λŸ‰λ³΄λ‹€ ν¬κ±°λ‚˜ 같은 값을 얻을 수 μžˆμ„ ν™•λ₯ μ„ λœ»ν•œλ‹€.
  • 일반적으둜 P-value(μœ μ˜ν™•λ₯ )의 μœ μ˜μˆ˜μ€€μ„ 0.05 즉, 5%둜 μ„€μ •ν•˜κ³ , 신뒰ꡬ간을 95%둜 μ„€μ •ν•œλ‹€.
  • μ—¬κΈ°μ„œ μ‹ λ’°κ΅¬κ°„μ΄λž€ λͺ¨μˆ˜κ°€ μ‹€μ œλ‘œ 포함될 것이라고 μ˜ˆμƒλ˜λŠ” λ²”μœ„λ₯Ό λ§ν•œλ‹€.
  • P-valueλŠ” κ΄€κ³„λ‚˜ 집단듀 사이에 차이가 μƒκ²¨λ‚˜λŠ” 것이 μš°μ—°ν•œ 것인지, λ³€μˆ˜μ— μ˜ν•œ 것인지 μ—¬λΆ€λ₯Ό λ°νžˆλŠ” κ²ƒμ΄λ‚˜, 이것이 νš¨κ³Όλ‚˜ λ³€ν™”μ˜ 정도, κ΄€κ³„μ˜ κ°•λ„λ‚˜ 크기 등을 μ„€λͺ…ν•˜λŠ” 것은 μ•„λ‹ˆλ―€λ‘œ μ£Όμ˜ν•΄μ•Όν•œλ‹€.

μ—‘μ…€μ—μ„œμ˜ t-test, F-κ²€μ •

  • μ—‘μ…€μ—μ„œλŠ” 데이터 뢄석 도ꡬλ₯Ό ν™œμš©ν•΄ t-test와 F-검정을 ν•  수 μžˆλ‹€.

    [데이터] νƒ­ β†’ [데이터 뢄석] 도ꡬ β†’ [F-κ²€μ •: 뢄산에 λŒ€ν•œ 두 집단] 선택
    [데이터] νƒ­ β†’ [데이터 뢄석] 도ꡬ -> [t-κ²€μ •: λ“±λΆ„μ‚° κ°€μ • 두집단] λ˜λŠ” [t-κ²€μ •: 이뢄산 κ°€μ • 두집단] 선택


λ‹€μŒμ€ μ œν’ˆ νŒ¨ν‚€μ§€ 변화에 λ”°λ₯Έ λ§€μΆœμ•‘ 데이터셋에 λŒ€ν•˜μ—¬ F-검정을 μ‹€μ‹œν•œ 결과이닀. μ΄λ•Œ F검정에 λŒ€ν•œ F값이 4.201이고, μœ μ˜μˆ˜μ€€μ€ 0.022μ΄λ―€λ‘œ μœ μ˜ν™•λ₯  p값인 0.05보닀 μž‘μœΌλ―€λ‘œ 귀무가섀을 κΈ°κ°ν•œλ‹€. λ”°λΌμ„œ 두 μ§‘λ‹¨μ˜ 평균에 μœ μ˜λ―Έν•œ 차이가 있기 λ•Œλ¬Έμ— 이뢄산 κ°€μ • t 검정을 μ‹€μ‹œν•œλ‹€.

이뢄산 κ°€μ • t-testλ₯Ό μ‹€μ‹œν•œ κ²°κ³Ό t-test에 λŒ€ν•œ t값은 3.15이고 μœ μ˜μˆ˜μ€€μ€ 0.007μ΄λ―€λ‘œ μœ μ˜ν™•λ₯  p값인 0.06보닀 μž‘μœΌλ―€λ‘œ 귀무가섀을 κΈ°κ°ν•œλ‹€. λ”°λΌμ„œ μ œν’ˆ νŒ¨ν‚€μ§€ 변화에 λ”°λ₯Έ λ§€μΆœμ•‘μ— λ³€ν™”κ°€ μžˆλ‹€.

0개의 λŒ“κΈ€