파이썬 라이브러리를 활용한 머신러닝 - 전처리

화이팅·2023년 2월 23일
0

machine_learning

목록 보기
8/12

출처 : 파이썬 라이브러리를 활용한 머신러닝 - 한빛미디어

  1. 비지도 변환 : 데이터 새롭게 표현, 다른 사람이나 다른 머신러닝 알고리즘 원래 데이터보다 쉽게 해석할 수 있도록
  2. 군집 : ㄷㅔ이터 비슷한 것 그룹으로 묶음

- 데이터 전처리
: 지도학습 알고리즘 적용하기 전 적용
스케일 객체는 분류모델, 회귀모델과 달리 fit메서드 호출 시, X_train 훈련데이터만 넘겨줌 -> fit메서드에서 학습한 변환 적용 시, 스케일 객체의 transform 메서드(새로운 데이터 표현 만들 때 사용) 사용

from sklearn.preprocessing import MinMaxScaler
scaler=MinMaxSclaer()
scaler.fit(X_train)
X_train_sclaed= scaler.transform(X_train)

  1. StandardScaler : 각 특성의 평균을 0, 분산 1로 변경 모든 특성이 같은 ㄱ크기 갖게 함
  2. RobustScaler : 평균과 분산 대신 중간 값과 사분위 값 사용 -> 이상치 영향 x
  3. MinMaxScaler : 모든 특성이 정확하게 0과 1사이에 위치하도록 데이터 변경
  4. Normalizer : 특성 벡터의 유클리디안 길이가 1이 되도록 데이터 포인트 조정 ( 각 데이터 포인트 다른 비율로 스케일 조정)
profile
하하...하.

0개의 댓글