[ML] 통신사 고객 이탈 예측 EDA_2

YJ·2023년 6월 20일
0

데이터 컬럼 확인하기

  • CustomerID: 고객 아이디
  • Churn: 이탈 Y/N
  • MonthlyRevenue: 월 수입
  • MonthlyMinutes: 월 사용 시간(단위: 분)
  • TotalRecurringCharge: 월별 총 지불 요금
  • DirectorAssistedCalls: 번호/주소 찾기 서비스 전화
  • OverageMinutes: 요금제를 초과해서 사용한 시간(단위: 분)
  • RoamingCalls: 로밍 전화수
  • PercChangeMinutes
  • PercChangeRevenues
  • DroppedCalls: 통화 중 끊긴 전화
  • BlockedCalls: 차단한 전화
  • UnansweredCalls: 부재중 전화
  • CustomerCareCalls: 통신사로부터 걸려온 고객 서비스 전화
  • ThreewayCalls
  • ReceivedCalls: 수신 전화
  • OutboundCalls: 발신 전화
  • InboundCalls: a customer initiates to a call center or contact center
  • PeakCallsInOut
  • OffPeakCallsInOut
  • DroppedBlockedCalls
  • CallForwardingCalls: 착신 전화
  • CallWaitingCalls: 통화중일 때 다른 전화 받기
  • MonthsInService: 서비스 이용 기간
  • UniqueSubs
  • ActiveSubs
  • ServiceArea: 서비스 지역
  • Handsets
  • HandsetModels
  • CurrentEquipmentDays: 현재 기기 사용 기간
  • AgeHH1, AgeHH2: 나이
  • ChildrenInHH: 자녀 Y/N
  • HandsetRefurbished: Y/N
  • HandsetWebCapable: web 사용 가능 Y/N
  • TruckOwner: 트럭 소유 Y/N
  • RVOwner: Recreational Vehicle 소유 Y/N
  • Homeownership: 주택 소유 Known/Unknown
  • BuysViaMailOrder: 통신 판매(온라인으로 기기 구매) Y/N
  • RespondsToMailOffers: 이메일 offer 응답 Y/N
  • OptOutMailings: Y/N
  • NonUSTravel: Y/N
  • OwnsComputer: Y/N
  • HasCreditCard: Y/N
  • RetentionCalls
  • RetentionOffersAccepted: retention offer 수락
  • NewCellphoneUser: 새 핸드폰 Y/N
  • NotNewCellphoneUser: 중고 핸드폰 Y/N
  • ReferralsMadeBySubscriber
  • IncomeGroup: 소득 계층(0~9)
  • OwnsMotorcycle: 오토바이 Y/N
  • AdjustmentsToCreditRating
  • HandsetPrice
  • MadeCallToRetentionTeam: Y/N
  • CreditRating: 신용 등급(1~7)
  • PrizmCode: 지역 코드(Town/Suburban/Rural/Other)
  • Occupation: 직업(Other/Professional/Crafts/Clerical/Self/Retired/Student/Homemaker)
  • MaritalStatus: 결혼 Y/N/Unknown

고객 이탈 비율

연령대

  • 나이가 0으로 표시된 고객을 제외하고 9세부터 92세까지 다양한 연령대의 고객이 존재한다.
  • 40대 고객이 가장 많고 30대도 많은 편이다.

자녀 유무

  • 자녀가 없는 고객의 이탈률이 더 높은 편이다.

결혼 여부

  • 기혼 고객의 이탈률이 더 높은 편이다.

직업

  • 사무직, 공예원, 주부, 전문직, 퇴직, 자영업, 학생, 기타 등의 직업으로 나눠졌다.
  • 기타를 제외하고 전문직의 이탈률이 가장 높았다.

소득 계층

  • 소득 수준을 0~9로 나누었을 때, 소득 계층이 0인 고객의 이탈률이 가장 높다.

신용카드 보유

  • 신용카드를 보유한 고객의 이탈률이 더 높은 편이다.

신용 등급

  • 신용 등급이 높은 고객(high, highest)이 이탈 고객의 절반 이상을 차지한다.

서비스 이용 기간

  • 이탈 고객과 미이탈 고객의 서비스 이용 기간을 비율로 나타냈을 때, 이탈 고객의 이용 기간은 11개월이 10.9%로 가장 많았고 12개월은 7.5%, 13개월은 6.1%를 차지한다.
  • 미이탈 고객의 서비스 이용 기간은 7개월이 6.6%로 가장 많았다.

현재 기기 사용 기간

  • 미이탈 고객의 기기 사용 기간이 짧은 쪽에 더 많이 분포되어 있다.

월별 사용량

  • 월별 이용 시간이 400분 미만인 고객: 전체 고객의 53%
  • 이용 시간이 400분 미만인 고객을 대상으로 box plot
  • 미이탈 고객의 이용 시간이 이탈 고객보다 조금 더 많다.

요금

  • 월별 요금이 60 미만인 고객: 전체 고객의 73%
  • 이탈 고객은 30달러 요금제를 가장 많이 사용한다.
  • 미이탈 고객은 45달러, 30달러 요금제를 많이 사용한다.

서비스 센터 전화

  • 전체 고객중에 1,745명(3.4%)이 서비스 센터에 전화를 했다.
  • 이탈 여부로 나누어 보면 서비스 센터에 전화를 한 고객은 이탈 고객의 5.3%, 미이탈 고객의 2.6%를 차지한다.
  • 만약 서비스 센터에 전화를 걸었던 고객이 모두 이탈하는 경우, 한달 수익의 3.6%가 감소하게 된다.

0개의 댓글