
회귀(영어: regress 리그레스[*])의 원래 의미는 옛날 상태로 돌아가는 것을 의미한다.
- 영국의 유전학자 프랜시스 골턴은 부모의 키와 아이들의 키 사이의 연관 관계를 연구하면서 부모와 자녀의 키사이에는 선형적인 관계가 있고 키가 커지거나 작아지는 것보다는 전체 키 평균으로 돌아가려는 경향이 있다는 가설을 세웠으며 이를 분석하는 방법을 "회귀분석"이라고 하였다. 이러한 경험적 연구 이후, 칼 피어슨은 아버지와 아들의 키를 조사한 결과를 바탕으로 함수 관계를 도출하여 회귀분석 이론을 수학적으로 정립하였다.
통계학에서 회귀 분석(regression analysis)은 관찰된 연속형 변수들에 대해 두 변수 사이의 모형을 구한 뒤 적합도를 측정해 내는 분석 방법이다.
회귀분석은 시간에 따라 변화하는 데이터나 어떤 영향, 가설적 실험, 인과 관계의 모델링등의 통계적 예측에 이용될 수 있다.
구분
단순회귀분석 (simple regression analysis)
다중회귀분석 (multiple regression analysis)
독립변수가 하나인 단순회귀모형에 대해 알아보겠습니다. 단순회귀모형의 구조는 다음과 같습니다.
i번째 측정된 y의 값i번째 주어진 독립변수의 값i번째 측정된 오차여기서 n은 관찰값(observed value)의 수입니다.
회귀식에 쓰일 회귀계수는 최소제곱법(The Method of Least Square) 또는 최대가능도추정법(The Method of Maximum Likelihood Estimation) 등을 통해 추정할 수 있습니다.
