[ML] 통신사 고객 이탈 예측 데이터셋

YJ·2023년 6월 8일
0

[제로베이스 데이터 취업 스쿨]

통신사 고객 이탈 예측

  • 데이터 불균형 문제: 다양한 방법 시도
  • 머신러닝 모델보다는 EDA에 집중하기
  • 고객 분석을 통한 인사이트 도출 및 시각화
  • 여러 데이터 수집 → 인원을 나눠서 EDA 하는 건 어떨까
    a) 데이터마다 EDA & 모델 학습 끝내고 다른 데이터 분석
    b) 데이터셋 여러 개 선정해서 EDA는 나눠서 진행, 모델 학습은 다 같이

Telco Customer Churn : 7,043개(50 columns)

  • 해당 고객이 지난 한 달 이내에 떠났는지 → 이탈 Y(27%), N(73%)
  • Country, State, City, Zip Code, Latitude, Longitude
  • Gender, Senior Citizen, Partner, Dependents
  • Tenure Months(통신사 이용 기간)
  • 서비스 여부
    Phone Service, Multiple Lines, Internet Service, Online Security, Online Backup, Device Protection, Tech Support, Streaming TV, Streaming Movies
  • Contract(Month-to-Month, One Year, Two Year)
  • Paperless Billing
  • Payment Method(Bank Withdrawal, Credit Card, Mailed Check)
  • Monthly Charge, Total Charges
  • CLTV: 고객 생애 가치
    The higher the value, the more valuable the customer. High value customers should be monitored for churn.
  • Churn Reason
  • Referred a Friend(Y/N), Number of Referrals(지인 소개)
  • Offer(가장 최근에 통신사가 고객에게 제안: offer A,B,C,D,E, None)
  • Avg Monthly Long Distance Charges, Total Long Distance Charges
  • Avg Monthly GB Download(데이터 다운로드)
  • Streaming Music(Y/N)
  • Premium Tech Support(Y/N)
  • Unlimited Data(Y/N)
  • Total Refunds
  • Total Extra Data Charges
  • Total Revenue
  • Satisfaction Score(1~5점)
  • Churn Category(Attitude, Competitor, Dissatisfaction, Other, Price)

출처: https://www.kaggle.com/datasets/sibelius5/telco-customer-churn

0개의 댓글