Variance. 분산.
벡터가 어느 정도 흩어져 있는 지 판단하는 지수.
Standard Deviation. 표준 편차.
분산에 루트. 값이 커진 것을 보완해 준다.
Covariance. 공분산.
하나의 데이터가 분산된 정도에 따라 다른 데이터의 분산도가 어떻게 관련이 있는 지 나타낸다.
Variance-covariance matrix. 공분산의 값을 나타내는 용어.
Correlation coefficient.
분산에 표준 편차를 이용하여 스케일을 줄여 단점을 보완한 것 처럼, 이 지수를 이용하여 보다 쉽게 공분산의 값을 찾아 낸다. 범위는 -1 부터 1까지 이다.
Orthogonality.
벡터 혹은 메트릭스가 수직으로 있는 것을 나타낸다.
1 of or involving right angles; at right angles.
2 Statistics (of variates) statistically independent.
• (of an experiment) having variates which can be treated as statistically independent.
단위 벡터 ( Unit Vectors )
선형대수에서, 단위 벡터란 "단위 길이(1)"를 갖는 모든 벡터.
벡터를 단위 벡터의 조합으로 표기
모든 벡터 ( 혹은 매트릭스 )는 단위 벡터의 선형 조합으로 표기.
v = [5, 30]
= [1, 0] 5 + [0, 1] 30
= 5 ⋅ 𝑖̂ + 30 ⋅ 𝑗̂
위의 예시처럼, ℝ2 내에 있는 임의의 벡터를 단위 벡터의 조합으로 표기할 수 있다.
Span.
두개의 벡터값으로 조합할 수 있는 모든 벡터. 이 벡터들은 다시 차원을 만들어 낸다.
다만 선형관계가 있는 벡터는 선위에서 움직이기 때문에 제외한다.
Rank. 는 벡터의 차원을 나타내는 단어이며 선형관계가 있다면 제외한다.
Gaussian Elimination.은 Rank를 알아내기 위한 계산 법이다.
Basis. 는 벡터의 기본 축을 뜻한다.
np.cov(v1,v2)[0,1] : v1,v2의 공분산.[]은 나타낼 수의 위치.
np.corrcoef(v1,v2) : 상관계수.
np.linalg.matrix_rank() : rank 값을 계산한다.
np.stack((l,m,n)) : array l,m,n을 수직으로 나열한다. stack 한다.
그래프 만들기
import matplotlib.pyplot as plt
plt.xlim(0, 10)
plt.ylim(-3, 10)
axes = plt.gca()
x_vals = np.array(axes.get_xlim())
y_vals = 0 * x_vals
화살표
plt.arrow(0, 0, proj[0], proj[1], linewidth = 3, linestyle = '--', head_width = .05, head_length = 1, color = 'green')