[P_stage] - week 5 Day 3

eric9687·2021년 9월 1일
0

[Day2] 2021/09/1

이미지 분류 대회 준비

  • cutmix코드 변경
    : 단순하게 이미지의 일부분을 다른 이미지에 적용시켰으나, 육안으로 확인한 이미지들은 의도와는 같지 못했다. 예를 들어 이미지 크기가 달라서 사람얼굴의 형태가 아닌 이상한 모습이 되는 경우가 많았다. 하지만, MTCNN으로 최대한 같은 사이즈에 비스슷한 위치에 얼굴이 있었기 때문에, 단순하게 두 이미지의 반반씩을 합치는 방식을 채용하였다. cutmix도 단순한 작업은 아니기 때문에 학습시간이 거의 2배로 늘어난다는 점...!
  • Stratified K fold Cross Validation
    • Cross validation
      : 모델을 학습시킬때, 학습 데이터셋을 과도하게 훈련하는 경우가 생길 수 있고 실제 데이터에 대해서는 좋은 성능을 보이지 못하는 과적합현상이 일어나는 경우가 빈번하다. 이때, 교차 검증은 validation 데이터셋을 바꿔가며 훈련을 검증하는데에 이용된다.
    • K fold cross validation
      : 학습데이터와 검증데이터를 K개의 폴드 세트로 만들어 K번 평가하는 방식을 말한다. 한번의 학습과 한번의 검증에도 일어날 수 있는 과적합을 예방하기위한 방법이다.
    • Stratified K fold cross validation
      : 이전의 K fold cross validation은 데이터셋이 랜덤하게 선택되어 분포가 고르지 못한 경우가 생길 위험성이 있다. 이를 방지하기위해 고른 분포로 데이터셋을 나누는 방법이다.
    • from sklearn.model_selection import StratifiedKFold를 사용하면 된다.
  • 점수를 높이는데 급급하여 일찍부터 준비했어야하는 validtion과정을 미루다가 늦게 적용한 것이 아쉽다. 어쩌면 이 방법이 모델 선택과 학습과정에 효율성을 높일 수 있었을텐데..

피어세션

  • validation 추가
  • cutmix코드 수정
  • 각자의 진행상황정리: 성능을 높이는 효과적인 방법은 없었다....ㅠ

마무리

  • 팀원들이 많이 낙담한 상태다...처음에 나도 좋은 모델을 선택하여 이런저런 시도로 어느정도의 성능을 보장시켰다는데에 기뻤지만, 더 향상시키지 못한 것에 속상하다. 또, 현업에서는 협업이 굉장히 중요하다고 하는데, 단합을 이끌어내지 못한 것도 조금 아쉬움이 남는다. 그렇지만, 아직 하루의 시간이 남았으니 최대한 노력해야한다! 남은 시간동안 기적이 일어날 수 있길!
profile
그러나 먼저 된 자로서 나중되고 나중 된 자로서 먼저될 자가 많으니라(마:19:30)

0개의 댓글