[ML] 통신사 고객 이탈 예측 EDA_1

YJ·2023년 6월 14일
0

[제로베이스 데이터 취업 스쿨]

데이터 전처리

  • service: No Phone Service, No internet Service 🡪 No
  • Yes = 1, No = 0
  • contract: Month to month = 1, One year = 12, Two year = 24
  • Customer Status: 'Joined' 삭제
  • 결측치: 미이탈 고객은 이탈 이유가 없음
  • 1차 drop
    customerId, Partner, churn_rate, Country, State, City, Zip Code, Lat Long, Latitude, Longitude

EDA

어떤 특성이 중요할지 몰라서 대부분의 컬럼을 가지고 EDA 진행

  • 고객 이탈률
  • 나이, 결혼, 부양가족
  • 계약 유형
  • 통신사 이용 기간
  • 지인 추천
  • 미이탈 고객이 더 많이 사용하는 서비스
    online_security, online_backup, device_protection, tech_support, premium_tech_support
  • 이탈 고객이 더 많이 사용하는 서비스
    internet_service, streaming_tv/movies/music, unlimited_data
  • 전자 고지서 여부
  • monthly charges
  • total revenue
  • 만족도 점수
  • CLTV
  • 의문점
    이탈 고객의 만족도: 보통, 불만족, 매우불만족
    미이탈 고객의 만족도: 보통, 만족, 매우만족
  • 인상깊었던 점
    미이탈 고객보다 이탈 고객의 한달 요금이 높은 곳에 분포되어 있다.
  • 2차 drop
    gender, age, referred_friend, offer, phone_service, multiple_lines, avg_monthly_GBdownload, avg_monthly_longDistance_charges, total_extraData_charges, payment_method, total_refunds, total_longDistance_charges, customer_status, churn_reason, churn_category, count, total_charges

모델에 사용된 데이터

6,589 행, 22개 컬럼

  • 수치형 변수
    tenure, referrals_num, monthly_charges, total_revenue, CLTV

  • 범주형 변수
    under30, senior, dependents, married, contract, internet_service, online_security, online_backup, device_protection, tech_support, streaming_tv, streaming_movies, streaming_music, premium_tech_support, unlimited_data, paperless_billing, satisfaction_score

0개의 댓글