[ML] Logistic Regression Model(3)

박건·2023년 9월 6일
0

[ML] Machine Learning

목록 보기
9/10

0. 들어가며


지난 포스팅에서는 Logistic Regression Model에서 paramter를 추정하는 방법에 대해 알아보았다.

이번 포스팅에서는 실제 예제를 다루며 어떻게 결과를 분석하고 해석하는지 알아보고자 한다.

1. Logistic Regression Model 예제


위는 대출 여부를 예측하는 데이터를 Logistic Regression Model을 이용하여 분석한 예시이다.

각 항목 Coefficient, Std.Error, p-value, Odds에 대하여 하나씩 알아보겠다.

우선 Coefficient는 모델에서 추정한 parameter값이다.

  • 해당 변수가 1단위 증가할 때, log Odds의 변화량을 의미
  • 양수이면 성공확률과 양의 상관관계, 음수이면 성공확률과 음의 상관관계

Std.Error은 추정한 parameter의 표준편차이다.

  • 추정 parameter의 신뢰구간(구간추정)을 구출할 때 사용

p-value는 해당 변수가 통계적으로 유의미한지 여부를 알려주는 지표이다.

  • 주로 가설검정을 할 때 사용하는 지표이고, 0.05를 기준으로 한다
  • p-value가 0.05보다 작으면 해당 변수가 유의하다고 판단, 0.05보다 크면 해당 변수가 유의하지 않다고 판단

Odds Ratio는 나머지 입력변수는 모두 고정시킨 상태에서 한 변수를 1단위 증가시켰을 때 변화하는 Odds의 비율을 의미한다.

예를 들어, Experience 변수의 Odds Ratio값이 1.058이라는 뜻은 경험이 1년 더 많으면 대출 확률이 1.058배 증가한다는 것이다.

2. 마치며


오늘은 Logistic Regression Model에서의 예제를 간단하게 알아보았다.

다음 포스팅에서는 Neural Network Model에 대하여 알아볼 예정이다.

또한 필자는 고려대학교 김성범 교수님이 운영하시는 유튜브 채널을 보고 공부한 내용을 포스팅 하였으므로 아래 출처를 남긴다.
https://www.youtube.com/@user-yu5qs4ct2b

profile
예비대학원생

0개의 댓글