공분산이란?
두개의 변수를 가지고 두 변수가 얼마나 연관성이 있는지 나타내고자 할 때 사용하는 분산.
cov(x,y) = E((x-E(x))(y-E(y)) = E(xy-E(x)y-E(y)x+E(x)E(y)) = E(xy) - E(x)E(y)
상관계수란?
상관계수는 공분산의 값을 -1과 1사이에 위치하도록 표준화한 값을 말한다.
공식: cov(x, y)/square(var(x))*square(var(y))
질문
왜 상관계수는 x와 y의 표준편차를 곱한 값으로 나누는 걸까?