다중공선성 문제를 해결하기 위한 회귀 방법 중 하나로, 독립변수(X)의 선형결합과 종속변수(Y)의 공분산을 최대화하는 변수를 활용하여 회귀식을 찾아내는 방법이다.
독립변수(X)의 선형결합의 분산을 최대화하는 변수를 활용하는 주성분회귀와 차이가 있으나, 두 방법 모두 변수의 개수를 줄일 수 있고, 다중공산성 문제를 해결할 수 있다는 점에서 공통점이 있다.
첫번째 PLS 변수(t1) 추출
2-1. 첫번째 X, Y 설정 X1=X,Y1=Y
2-2. 공분산이 최대가 되도록하는 가중치 w1 계산 w1=‖X1TY1‖X1TY1(∵‖w1‖=1)
2-3. 가중치 w1을 이용하여 첫번째 PLS 변수(t1) 추출 t1=X1w1
2-4. t1의 회귀계수 b1을 계산 Y1=t1b1+F1 b1=(t1Tt1)−1t1TY1 (by 최소제곱법)
두번째 PLS 변수(t2) 추출
3-1. 두번째 X, Y 설정
⭐ 앞서 t1이 설명한 부분은 제거하고, t1이 설명하지 못한 부분(F1)에 다시 최소제곱법을 적용한다. X1=t1p1T+E1(p1T=(t1Tt1)−1t1TX1) (by 최소제곱법)
➡ X2=E1=X1−t1p1T Y1=t1b1+F1
➡ Y2=F1=Y1−t1b1
3-2. 공분산이 최대가 되도록하는 가중치 w2 계산
3-3. 가중치 w2을 이용하여 두번째 PLS 변수(t2) 추출
3-4. t2의 회귀계수 b2을 계산
같은 방식으로 k번째 PLS 변수(tk) 추출
4-1. k번째 X, Y 설정 Xk−1=tk−1pk−1T+Ek−1(pk−1T=(tk−1Ttk−1)−1tk−1TXk−1)
➡ Xk=Ek−1=Xk−1−tk−1pk−1T Yk−1=tk−1bk−1+Fk−1
➡ Yk=Fk−1=Yk−1−tk−1bk−1
4-2. 공분산이 최대가 되도록하는 가중치 wk 계산 wk=‖XkTYk‖XkTYk(∵‖wk‖=1)
4-3. 가중치 wk을 이용하여 두번째 PLS 변수(tk) 추출 tk=Xkwk
4-4. tk의 회귀계수 bk을 계산 Yk=tkbk+Fk bk=(tkTtk)−1tkTYk (by 최소제곱법)