학습 데이터와 테스트 데이터의 스케일링 변환 시 유의점

양콩공·2022년 9월 14일
0

머신러닝

목록 보기
1/2

fit() - 데이터 변환을 위한 기준 정보 설정을 적용
transform() - fit에서 설정된 정보를 이용해 데이터를 변환
fit_transform() - 이 둘을 한번에

—> 전체 데이터의 스케일링 변환을 적용한 뒤, 학습과 테스트 데이터를 분리
why? 테스트 데이터로 새로운 스케일링 기준 정보를 만들게 되면, 학습 데이터와 테스트 데이터의 스케일링 기준 정보가 달라지기 때문에 올바른 예측 결과 도출이 어려움

—> 위에 과정을 못했다면, 테스트 변환 시에는 fit() 이나 fit_transform()을 하지 않고,
학습 데이터로 이미 fit() 된 Scaler 객체를 이용해 transform()만 사용해서 변환

profile
👩‍💻

0개의 댓글