공분산과 상관계수

경지현·2023년 9월 11일
0

자료과학

목록 보기
2/10

공분산이란?

두개의 변수를 가지고 두 변수가 얼마나 연관성이 있는지 나타내고자 할 때 사용하는 분산.
cov(x,y) = E((x-E(x))(y-E(y)) = E(xy-E(x)y-E(y)x+E(x)E(y)) = E(xy) - E(x)E(y)

상관계수란?

상관계수는 공분산의 값을 -1과 1사이에 위치하도록 표준화한 값을 말한다.
공식: cov(x, y)/square(var(x))*square(var(y))

질문

왜 상관계수는 x와 y의 표준편차를 곱한 값으로 나누는 걸까?

profile
그냥 사람

0개의 댓글