ai competition

naem1023·2021년 8월 23일
0

Ai competition

목록 보기
1/17

접근방법

  • 대회 시작하자마자 데이터 열어보지말고 overview check.

EDA(Exploratory Data Analysis)


탐색적 데이터 탐색.

  • input이 될 X에 대한 분석
  • target이 될 y에 대한 분석
  • X, y관계를 확인할 수 있는 분석

EDA in image classification

  • input이 될 X에 대한 분석
    • X는 Image가 됩니다. X에 대한 특성(feature)은 어떤 것이 있을까요??
  • 이미지 사이즈
  • 분석 대상이 되는 객체의 위치
  • RGB 채널별 통계 값
    - 이미지에서 r,g,b 중 어떤 것이 유독 강한가?
  • target이 될 y에 대한 분석
    - y는 저희가 맞추고자 하는 값이며 y값에 대한 특성은 어떤 것이 있을까요??
  • y값에 독립적 분포 확인
    - class의 개수를 확인해보자.
    - ex) y_1의 분포는?
  • y값 들간의 관계 분포 확인
    - class 간의 개수가 확연하게 차이가 나는가?
    - ex) y_1, y_2 정보를 섞은 분포는?
  • X, y 관계를 확인할 수 있는 분석
    - X특성과 y의 특성 간의 분포 차이는 어떻게 있을까요??
  • 이미지 사이즈와 y 특성의 관계
    - 이미지를 키웠을 때 학습이 잘 되는 경우도 있다.
    • 이미지의 사이즈를 바꿨을 때 학습이 잘 되는 경우를 찾아보자.
  • RGB 통계값과 y 특성의 관계
    - rgb channel shift: r,g,b의 순서를 섞어서 채널에 종속되게 학습하지 않도록.
  • 객체의 위치와 y 특성의 관계
  • 데이터의 노이즈 확인
    - ex) y 값이 잘못 부여된것이 있을까??
profile
https://github.com/naem1023

1개의 댓글

comment-user-thumbnail
2021년 8월 23일

박성호! 박성호! 박성호!

답글 달기