데이터 분석에 정말 기초가 되는 지식들이기 때문에 간략하게 정리해놓고 넘어가려 한다.(산술)평균(average)$$\\bar{x} = {1\\over n}\\sum\_{i=1}^{n}x_i$$모집단인 경우 평균은 μ로 나타낸다.중앙값(median)데이터를 크기 순으로
주성분 분석이란 고차원의 데이터를 저차원의 데이터로 환원시키는 기법이다. 여기서 '차원'은 변수의 개수를 의미하므로, 많은 변수를 최대한 정보의 손실 없이 압축하여 그 개수를 줄이는 알고리즘이라고 이해하면 된다. 데이터를 압축하지 않더라도, 기본적으로 데이터의 특성이
회귀분석(regression analysis)이란두 변수 사이의 관계를 방정식으로 구하는 것. 크게 단순회귀와 다중회귀로 나뉜다. 단순회귀는 독립변수가 1개이고, 다중회귀는 독립변수가 2개 이상으로 구성된다.회귀식단순회귀: $y = w_0x_0 + w_1x_1$ ($x
부분최소제곱법이란 다중공선성 문제를 해결하기 위한 회귀 방법 중 하나로, 독립변수(X)의 선형결합과 종속변수(Y)의 공분산을 최대화하는 변수를 활용하여 회귀식을 찾아내는 방법이다. 독립변수(X)의 선형결합의 분산을 최대화하는 변수를 활용하는 주성분회귀와 차이가 있으나