분류 / 회귀 데이터
knn_model = knc()
r=cross_val_score(knn_model,X_train,y_train,cv = )
r.mean()
knn_model.fit(X_train,y_train)
pre2=knn_model.predict(X_test)
result2=pd.read_csv('data/gender_submission.csv')
result2['Survived'] = pre2
result2.to_csv("JYP1.csv", index = False)
성능개선사항
하이퍼 파라미터 조정(5%)
데이터의 양 늘려보기
전처리 신경쓰기
성능이 좋은 모델 가져와서 학습
데이터 스케일링 진행
거리계산에 민감한 knn모델의 성늘을 조금 더 높이기 위해서 데이터의 규모, 단위를 정리해주는 과정
sklearn 에서 Scale 제공
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
scaler.transform(X_train)
scaler.fit(X_train)
t_X_train=scaler.transform(X_train)
t_X_test=scaler.transform(X_test)
cross_val_score(knn_model,t_X_train,y_train, cv=20)
tree_model.fit(t_X_train,y_train)
pre3=tree_model.predict(t_X_test)
result2['Survived']=pre3
result2.to_csv("JYP2.csv", index = False)