회귀 분석은 둘 이상의 변수 간의 관계를 보여주는 통계적 방법이다. 일반적으로 그래프로 표현되는데, 이 방법은 종속 변수와 독립 변수 간의 관계성을 기반으로 만들어짐.
--> 넓은 의미로는 독립변수(x)로 종속변수(y)를 예측하는 것을 의미한다.
독립변수와 종속변수
y = 3x+3에서 y는 x의 값에 따라 바뀌므로 종속변수, x는 독립변수이다.
독립변수 : 변화에 영향을 주는 변수 -> 연구자가 의도적으로 변화시키는 변수
종속변수 : 변화에 영향을 받는 변수 -> 연구자가 독립변수의 변화에 따라 어떻게 변하는지 알고 싶어하는 변수
선형 회귀 분석
선형회귀 분석은 회귀 분석의 대표적인 방법이다. 선형 회귀는 종속변수 y와 한개 이상의 독립변수 x와의 선형 상관관계를 모델링하는 회귀 분석 기법이다.
선은 실제 데이터와 약간의 차이가 발생한다. 그러한 오차를 손실(Loss)라고 부른다.
아무튼 선형회귀 모델의 목표는 모든 데이터로부터 나타나는 오차의 평균을 최소화할 수 있는 최적의 기울기와 절편을 찾는 것임.