# Leakage prevention

1개의 포스트
post-thumbnail

AIB: N214 Logistic Regression

1. Logistic Regression 1.1 Training/Validation/Testing Data 훈련, 검증, 테스트 데이터로 나눠야하는 이유: Training(훈련): 훈련 데이터를 기준으로 모델을 학습(Fit)시킨다. Construct classifier. Validation(검증): 훈련한 모델의 유효성을 확인한다. 마지막으로 시험치기 전에 성능을 확인하거나 향상시키는 방법. 예측의 오류(Residual)를 측정한다. 수능을 치기 전에 모의고사를 보는 느낌 Pick algorithm and Knob the settings. Testing(테스트): 훈련한 모델의 성능이 좋은지, 안 좋은지 확인하는 데이터(Score), 마지막에 딱 한번만 사용한다. Estimate future error rate. Kaggle(캐글)이 테스트 데이터를 제공하지 않는 이유: 모델의 일반화 성능을 올바르게 측정하기 위해서. 타겟 값까지 알려주면 그것을 토대로 사

2022년 3월 3일
·
0개의 댓글
·