[P_stage] - week 4 Day 1

eric9687·2021년 8월 26일
0

[Day1] 2021/08/23

강의 리뷰

-이미지분류 1,2강: Image Classification & EDA

  • EDA(Exploratory data Analysis): 데이터에 탐색적으로 분석, 절대 거창한 것이 아님.
  • Image: 시각적 인식을 표현한 인공물. (width, height, channel)
  • Input + Model = Output
    Image + Classification Model = Class

과제 (스페셜 미션)

: 이미지 분류 대회의 마스크 관련 데이터를 EDA해보았다.

  • 본래 데이터는
  • race는 Asian이기 때문에, 분류에 쓰지 않음.
  • gender, Age_class와 Mask착용상태에 따라 class가 나뉘게 된다.
    ex)
  • 그래서 데이터를 성별에 따른 나이 분포와 나이에 따른 성별 분표를 한 눈에 볼 수 있도록 시각화하였다.

  • 위의 차트를 보았을때 60대의 데이터는 상당히 적다
    전체적인 데이터의 비율은 아래와 같다.
  • 성별과 관계없는 60의 데이터는 전체적인 데이터의 밸런스를 망치는 가장 큰 요인인 될 것이다.
  • 따라서, 이번 대회에서는 60대 데이터에 대한 Augmentation이 성능의 큰 지표가 될 것 같다.

피어세션

  • 이미지 분류 대회 데이터에 대한 분석
    : 위 과제 부분과 같음
  • 대회 접근법에 대한 토의
    : cut-mix, object detection, bounding box에 대한 의견이 나왔다
  • data augmentation에 대한 조사 필요성 찾음

마무리

: 시각화를 통해서 데이터를 분석해보니 흥미로웠다. 역시 개인적으로 눈에 보이는게 좋은 것 같다.하하.
하지만 이것을 어떻게 성능 좋은 모델로 분류시키냐가 큰 관건이다. 데이터강화가 불가피해보이는데 그에 대한 방안 모색이 필요하다. 즉...이것저것 알아보고 해야된다는..ㅎㅎ
본격적으로 이미지 분류 대회가 시작되니 긴장된다. 멘토님이 대회 시작되면 사람들이 잠을 안 잔다고 하셨는데...네..지금 제가 잘하고 있는건지 모르겠지만 그러고 있습니다...내일은 더 많은 것을 배우는 시간이 될 수 있길 바란다.

profile
그러나 먼저 된 자로서 나중되고 나중 된 자로서 먼저될 자가 많으니라(마:19:30)

0개의 댓글