Logistic Regression

TaeWoo Lee / Kris·2021년 12월 19일
2
post-thumbnail

훈련/검증/테스트(train/validate/test) 세트

  • 훈련세트로 모델을 한 번에 완전하게 학습시키기가 어렵기 때문
  • 훈련세트로 다르게 튜닝된 여러 모델들을 학습한 후 어떤 모델이 학습이 잘 되었는지 검증하고 선택하는 과정이 필요
  • 련/검증세트로 좋은 모델을 만들어 낸 후 최종적으로 테스트세트에는 단 한번의 예측테스트를 진행

분류(Classification)

분류문제는 회귀문제와 다른 기준으로 기준모델을 설정

  • 회귀문제에서는 보통 타겟 변수의 평균값을 기준모델로 사용
  • 분류문제에서는 보통 타겟 변수에서 가장 빈번하게 나타나는 범주를 기준모델로 설정
  • 시계열(time-series) 데이터는 보통 어떤 시점을 기준으로 이전 시간의 데이터가 기준모델
  • 분류 평가지표(evaluation metrics)
    • 정확도(Accuracy) 는 분류문제에서 사용하는 평가지표
    • Accuracy = 올바르게예측한수전체예측수\frac{올바르게 예측한 수} {전체 예측 수} = TP+TNP+N\frac{TP + TN} {P + N}
    • Proportion of correct classifications

로지스틱 회귀(Logistic Regression)

  • 로지스틱회귀를 사용하면 타겟변수의 범주로 0과 1을 사용할 수 있으며 각 범주의 예측 확률값을 얻을 수 있음

  • 로지스틱 회귀모델은 다음 식으로 표현할 수 있음
    P(X)=11+e(β0+β1X1++βpXp)\large P(X)={\frac {1}{1+e^{-(\beta _{0}+\beta _{1}X_{1}+\cdots +\beta _{p}X_{p})}}}
    0P(X)10 \leq P(X) \leq 1

  • 결과적으로 관측치가 특정 클래스에 속할 확률값으로 계산

  • 분류문제에서는 확률값을 사용하여 분류를 하는데 예를들어 확률값이 정해진 기준값 보다 크면 1 아니면 0 이라고 예측

Logit transformation

  • 로지스틱회귀의 계수는 비선형 함수 내에 있어서 직관적으로 해석하기가 어려운데 오즈(Odds) 를 사용하면 선형결합 형태로 변환 가능해 보다 쉽게 해석이 가능
  • 오즈는 실패확률에 대한 성공확률의 비 인데 예를들어 odds = 4 이면 성공확률이 실패확률의 4배 라는 뜻
  • 분류문제에서는 클래스 1 확률에 대한 클래스 0 확률의 비라고 해석
  • Odds=p1pOdds = \large \frac{p}{1-p},
    p = 성공확률, 1-p = 실패확률
    p = 1 일때 odds = \infty
    p = 0 일때 odds = 0
    ln(Odds)=ln(p1p)=ln(11+e(β0+β1X1++βpXp)111+e(β0+β1X1++βpXp))=β0+β1X1++βpXp\large ln(Odds) = ln(\frac{p}{1-p}) = ln(\frac{\frac {1}{1+e^{-(\beta _{0}+\beta _{1}X_{1}+\cdots +\beta _{p}X_{p})}}}{1 - \frac {1}{1+e^{-(\beta _{0}+\beta _{1}X_{1}+\cdots +\beta _{p}X_{p})}}}) = \normalsize \beta _{0}+\beta _{1}X_{1}+\cdots +\beta _{p}X_{p}
  • 이렇게 오즈에 로그를 취해 변환하는 것을 로짓변환(Logit transformation) 이라고 함
  • 특성 X의 증가에 따라 로짓(ln(odds))가 얼마나 증가(or감소)했다고 해석
  • 기존 로지스틱형태의 y 값은 0~1의 범위를 가졌다면 로짓은 - ∞ ~ ∞ 범위를 가지게 됨
profile
일단 저지르자! 그리고 해결하자!

0개의 댓글