Ridge Regression

TaeWoo Lee / Kris·2021년 12월 19일

Code States [AI_09] Section2

목록 보기

3/12

Ridge 회귀는 기존 다중회귀선을 훈련데이터에 덜 적합이 되도록 만든다는 것
- $\beta_{ridge}$ : $argmin[\sum_{i=1}^n(y_i - \beta_0 - \beta_1x_{i1}-\dotsc-\beta_px_{ip})^2 + \lambda\sum_{j=1}^p\beta_j^2]$
- n: 샘플수, p: 특성수, $\lambda$ : 튜닝 파라미터(패널티)
  참고: alpha, lambda, regularization parameter, penalty term 모두 같은 뜻
Ridge 회귀는 과적합을 줄이기 위해서 사용하는 것
과적합을 줄이는 간단한 방법 중 한 가지는 모델의 복잡도를 줄이는 방법
특성의 갯수를 줄이거나 모델을 단순한 모양으로 적합하는 것
Ridge 회귀는 이 편향을 조금 더하고, 분산을 줄이는 방법으로 정규화(Regularization)를 수행
정규화의 강도를 조절해주는 패널티값인 람다의 성질
- $\lambda$ → 0, $\beta_{ridge}$ → $\beta_{OLS}$
- $\lambda$ → ∞, $\beta_{ridge}$ → 0.
기존의 OLS(Ordinary Least Squares)가 아래에 보이는 제약조건까지 와야지 최적값이라고 할 수 있는 것
OLS가 제약조건까지 오기 위해서는 RSS(RSS : residual sum of squares) 크기를 키워주게 됨
bias가 약간의 희생은 하지만 variance를 줄이기 위해서 아래의 그림처럼 제약조건까지 오는 가장 작은 RSS를 고르면 됨

릿지회귀 참조 사이트

일단 저지르자! 그리고 해결하자!