Logistic Regression
훈련, 검증, 테스트
- 훈련/검증 데이터로 좋은 모델을 만들고, 테스트 데이터로 한 번의 테스트 진행
훈련 : fit
검증 : 과적합 방지
테스트 : 일반화 성능 측정
Logistic Regression
- 타겟의 범주로 0, 1을 사용하는 분류 모델
- 각 범주 확률값 얻을 수 있음
P(X)=1+e−(β0+β1X1+⋯+βpXp)1
오즈(Odds)
- 실패확률에 대한 성공확률의 비
Odds=1−pp
- 로지스틱 회귀의 계수를 선형결합 형태로 변형해 해석을 용이하게 함
로짓(Logit) 변환
- 오즈에 로그를 취해 변환하는 것(로지스틱 회귀 분석)
ln(Odds)=ln(1−pp)=ln(1−1+e−(β0+β1X1+⋯+βpXp)11+e−(β0+β1X1+⋯+βpXp)1)=β0+β1X1+⋯+βpXp
- 타겟의 확률을 연속형 척도로 변환(특성과 타겟의 관계 선형 분석)
모델링
logistic = LogisticRegression()
logistic.fit(X_train, y_train)
y_pred = logistic.predict(X_val)
y_pred_proba(X_val)
분류 평가지표
Accuracy(정확도)
= P+NTP+TN