embedding 32, drop 0.3 early 15 lr 0.0001 batch 128 =>0.087/0.137
em32, drop0.3 early15, lr 0.001, batch64, heads8=>0.084/0.134
베스트 모델로 제대로 하고나서 train 0.011떴는데 test 0.20 ..... ->
배치64로 늘리고 손실함수 다시 mae로 바꿔봄: 0.08/0.13 ->엥 그대로? 그럼 확실히 손실함수때문인지 배치 때문인지 보기 위해서
배치 64로 하고 손실함수만 다시 huber로바꿔봄.: 0.017/0.149
배치 32로 하고 손실함수 huber로 바꿔봄: train 0.011, test 0.156
위와 그대로, 드롭아웃 0.6으로: 0.019, test 0.21
드롭아웃 0.3, embedding 32: 0.0113, test 0.190
=> 배치를 늘리는 게 좋겟다. , 드롭아웃은 낮게, 임베딩 32 ㄱㅊ
배치48로 바꿔봄: 0.011, test 0.1811
배치 128로 해봄: 0.012/ 0.1720
다른 값 고정하고 early_stopping 10으로 바꿈: 0.15/0.31
early_stopping 20: 0.011/0.153
batch size: 128, learning rate: 0.001, embedding size: 32, dropout rate: 0.3, early stopping rounds: 20 => train 0.011/test 0.164
batch size: 128, learning rate*: 0.0001, embedding size: 32, dropout rate: 0.3, early stopping rounds: 20=> 0.0123/0.189
batch size: 128, learning rate: 0.001, embedding size: 32, dropout rate: 0.3, early stopping rounds: 10 => 0.012/0.165
kfold 해봣음
dropout 0.3: fold1 train 0.0113, test 0.21
fold2 train 0.0111 test 0.211
dropout 0.6, embedding 32: fold1 train 0.02 test 0.26
early stopping 15, embedding size를 16, dropout 0.6: fold1 train 0.0144 test 0.242
early stopping 10, embedding 32로 함: 0.0116/0.1929
embedding 32, dropout 0.3, early_stopping 10, lr 0.001, batch size 64로 했을 때
Fold 0 - Best Val Loss: 0.011580062371774995
Fold 0 - Test MAE: 0.192914978160153
Fold 1 - Best Val Loss: 0.011275936631933535
Fold 1 - Test MAE: 0.21667281103158348
Fold 2 - Best Val Loss: 0.011204434116701568
Fold 2 - Test MAE: 0.18303773649327953
Fold 3 - Best Val Loss: 0.011127204566714155
Fold 3 - Test MAE: 0.23261216033357826
Fold 4 - Best Val Loss: 0.010967851881387419
Fold 4 - Test MAE: 0.1931642948643681
=> k fold 안하는게 더 낫나????ㅠㅠ 아근데 여기서 false false 했던 게 있어서.... 하ㄱㄷ
false로 바꿨음!: 0.013/0.111 & 0.012/0.117
모델이 너무 복잡하니까 파라미터를 낮추면됨
TEST SET 목표: 0.0175 !!!!!!
embedding_size = 32
dropout_rate = 0.3
early_stopping_rounds = 20
대역 2 수업 / 제안
데이터과학 겨울캠프
첫째날 : 고형석 교수님 파이토치 강연
둘째날 : 첫째날과 이어서 파이토치 강연
셋째날 : 천둥 연구실에서의 쿠다 강연
넷째날 : 인텔 OneAPI 강연
KISTI 계정 신청했던 결과가 나왔다. 통과!!!!!!!
이제 연구실에서 GPU를 사용할 수 있게 되었다.
아직 서버는 쓰지 못해서 계정만 신청해놓았지만 1월 1일부터 데이터 옮기고 모델 실험해봐야지....
두근두근....