[제로베이스 데이터 취업 스쿨]
통신사 고객 이탈 예측
- 데이터 불균형 문제: 다양한 방법 시도
- 머신러닝 모델보다는 EDA에 집중하기
- 고객 분석을 통한 인사이트 도출 및 시각화
- 여러 데이터 수집 → 인원을 나눠서 EDA 하는 건 어떨까
a) 데이터마다 EDA & 모델 학습 끝내고 다른 데이터 분석
b) 데이터셋 여러 개 선정해서 EDA는 나눠서 진행, 모델 학습은 다 같이
Telco Customer Churn : 7,043개(50 columns)
- 해당 고객이 지난 한 달 이내에 떠났는지 → 이탈 Y(27%), N(73%)
- Country, State, City, Zip Code, Latitude, Longitude
- Gender, Senior Citizen, Partner, Dependents
- Tenure Months(통신사 이용 기간)
- 서비스 여부
Phone Service, Multiple Lines, Internet Service, Online Security, Online Backup, Device Protection, Tech Support, Streaming TV, Streaming Movies
- Contract(Month-to-Month, One Year, Two Year)
- Paperless Billing
- Payment Method(Bank Withdrawal, Credit Card, Mailed Check)
- Monthly Charge, Total Charges
- CLTV: 고객 생애 가치
The higher the value, the more valuable the customer. High value customers should be monitored for churn.
- Churn Reason
- Referred a Friend(Y/N), Number of Referrals(지인 소개)
- Offer(가장 최근에 통신사가 고객에게 제안: offer A,B,C,D,E, None)
- Avg Monthly Long Distance Charges, Total Long Distance Charges
- Avg Monthly GB Download(데이터 다운로드)
- Streaming Music(Y/N)
- Premium Tech Support(Y/N)
- Unlimited Data(Y/N)
- Total Refunds
- Total Extra Data Charges
- Total Revenue
- Satisfaction Score(1~5점)
- Churn Category(Attitude, Competitor, Dissatisfaction, Other, Price)
출처: https://www.kaggle.com/datasets/sibelius5/telco-customer-churn