πŸ“‹[Excel] 데이터 뢄석 (상관 뢄석)

thisk336Β·2023λ…„ 10μ›” 7일
0

Excel

λͺ©λ‘ 보기
6/11
post-thumbnail

상관 λΆ„μ„μ΄λž€?

  • 상관뢄석은 두 λ³€μˆ˜κ°€ μ–΄λ–€ μ„ ν˜•μ  관계λ₯Ό κ°–κ³  μžˆλŠ”μ§€λ₯Ό λΆ„μ„ν•˜λŠ” 방법을 λ§ν•œλ‹€.
  • μ—¬κΈ°μ„œμ˜ μ„ ν˜•μ  κ΄€κ³„λŠ” 상관 관계λ₯Ό μ˜λ―Έν•˜λŠ”λ° 상관 κ΄€κ³„λž€ ν•œμͺ½μ΄ μ¦κ°€ν•˜λ©΄ λ‹€λ₯Έ μͺ½λ„ μ¦κ°€ν•˜κ±°λ‚˜ λ°˜λŒ€λ‘œ κ°μ†Œλ˜λŠ” κ²½ν–₯을 μΈμ •ν•˜λŠ” 두 μ–‘(量) μ‚¬μ΄μ˜ 톡계적 관계λ₯Ό λ§ν•˜λ©° 상관 κ³„μˆ˜λ₯Ό 톡해 νŒŒμ•…ν•œλ‹€.
  • 상관 κ³„μˆ˜λž€ 두 λ³€μˆ˜ μ‚¬μ΄μ˜ 상관성을 λ‚˜νƒ€λ‚΄λ©° 일반적으둜 ν”Όμ–΄μŠ¨(Pearson) 상관 κ³„μˆ˜λ₯Ό μ‚¬μš©ν•œλ‹€. 상관 κ³„μˆ˜κ°€ 1에 κ°€κΉŒμšΈ 수둝 μ–‘μ˜ 상관 관계(μ •λΉ„λ‘€), -1에 κ°€κΉŒμšΈμˆ˜λ‘ 음의 상관 관계(λ°˜λΉ„λ‘€)λ₯Ό 가진닀고 λ§ν•œλ‹€.
  • 일반적으둜 κΈ°μ€€λ§ˆλ‹€ 차이가 μžˆμ§€λ§Œ μƒκ΄€κ³„μˆ˜μ˜ μ ˆλŒ“κ°’μ΄ 0.5 이상이면 κ°•ν•œ 상관 관계, 상관 κ³„μˆ˜μ˜ μ ˆλŒ“κ°’μ΄ 0.2 μ •λ„μ˜ μˆ˜μ€€μ΄λ©΄ μ•½ν•œ 상관 관계, 상관 κ³„μˆ˜μ˜ μ ˆλŒ“κ°’μ΄ 0에 κ°€κΉŒμš°λ©΄ 상관 관계가 μ—†λ‹€κ³  λ³Έλ‹€.

μ—‘μ…€μ—μ„œμ˜ 상관 뢄석

  • μ—‘μ…€μ—μ„œλŠ” 데이터 뢄석 도ꡬλ₯Ό ν™œμš©ν•΄ μ‰½κ²Œ 상관 λΆ„μ„ν‘œλ₯Ό λ§Œλ“€ 수 μžˆλ‹€.

    [데이터] νƒ­ β†’ [데이터 뢄석] 도ꡬ β†’ [상관 뢄석] β†’ [μž…λ ₯ λ²”μœ„] μ„€μ •


ν•΄λ‹Ή 그림은 엑셀을 ν™œμš©ν•΄μ„œ κ΄‘κ³ λΉ„, κ΅μœ‘λΉ„, νŒλ§€μˆ˜λŸ‰ λ“±μ˜ λ‹€μ–‘ν•œ μ§€ν‘œ κ°„ 상관 κ³„μˆ˜ν‘œλ₯Ό μž‘μ„±ν•œ 것이닀.
쑰건뢀 μ„œμ‹μ„ ν™œμš©ν•΄ 상관 κ³„μˆ˜μ˜ μ ˆλŒ“κ°’μ΄ λ†’μ„μˆ˜λ‘ μƒ‰μœΌλ‘œ ν‘œν˜„ν•  수 μžˆλ‹€.

상관 λΆ„μ„μ˜ ν™œμš©

  • 상관 뢄석은 인과 관계가 μžˆμ„ κ²ƒμœΌλ‘œ μ˜ˆμƒλ˜λŠ” λ³€μˆ˜λ“€μ„ 선별해 λΆ„μ„μ˜ μš°μ„ μˆœμœ„λ₯Ό μ •ν•  수 μžˆμ–΄ μ‹œκ°„κ³Ό λΉ„μš©μ˜ νš¨μœ¨μ„± μ¦λŒ€μ‹œμΌœ μ€€λ‹€.
  • 인과 관계λ₯Ό 가지고 μžˆλŠ” 두 λ³€μˆ˜λŠ” 항상 κ°•ν•œ 상관 관계λ₯Ό 가지고 μžˆμ§€λ§Œ, κ°•ν•œ 상관 관계λ₯Ό 가지고 μžˆλ‹€κ³  ν•΄μ„œ 두 λ³€μˆ˜κ°€ λ°˜λ“œμ‹œ 인과 관계λ₯Ό κ°€μ§€λŠ” 것은 μ•„λ‹ˆλ―€λ‘œ μœ μ˜ν•΄μ•Ό ν•œλ‹€.

0개의 λŒ“κΈ€