[ML] 통신사 고객 이탈 예측 모델_2

YJ·2023년 6월 21일
0

[제로베이스 데이터 취업 스쿨]

1. 범주형 데이터 처리

  • Yes는 1로, No는 0으로 변경
  • Homeownership 컬럼의 Known: 1, unknown: 0으로 변경
  • MaritalStatus 컬럼의 Unknown: 2로 변경
  • HandsetPrice 컬럼의 Unknown: Null로 변경
  • 나머지 범주형 변수(CreditRating, PrizmCode, Occupation)는 라벨인코더 적용

2. 결측치 제거

3. 결측치 대체(최빈값/평균값)

4. outlier 제거

5. 수치형 변수 scaler

이상치 제거된 상태에서 적용

  • Standardscaler
  • Minmaxscaler
  • Robustscaler

6. oversampling

  • SMOTE
  • Borderline SMOTE
  • ADASYN

0개의 댓글