Ensemble에 대해 조사해봐야 했지만, 주중에 다른 일이 생겨 많이 조사하지는 못했다.
일단 soft voting을 하려면 팀원들이 모델 output을 수정하여야 해 번거롭기도 하고, segmentation 특성상 모델 3개 이상이면 hard voting으로도 어느정도 성능이 나올 것 같아 일단 hard voting 코드는 구현해 둘 생각이다.
추가로 기존 baseline 코드에 HRNet OCR을 적용해 모델 학습을 시켜보았다. 성능은 0.6 정도로 기존 Efficient-unet을 썼을 때보단 높았지만 팀원들의 swin transformer에 비하면 현저히 낮은 수치였다. validation set 없이 all train dataset으로 학습하니 0.63까지 score를 올릴 수 있었다.
아직 팀원들이 Pseudo labeling을 활용한 학습을 완성하지 못해서, 내일 오전부터 ensemble 코드를 짜면서 inference 파일들을 받아 ensemble을 진행해야 할 것 같다.