Day01
Set team random seed
Today Mission
- 간단한 데이터 접근 ( 주어진 데이터의 세분화 된 category 분포 확인 )
- Special mission 채워보기
- Data Loader 작성
Day02
EDA
DataSet DataLoader
- 이미지 path
- 전처리로 이미지 확장자 변환을하고 파일명을 고정시켜서 path를 지정한 경우와 os.listdir로 수시로 받아와서 이미지 path를 지정한 경우가 있었다.
- 데이터 라벨
- 데이터라벨을 if else로 다 때려박는 방법과 라벨을 지정하는 방법을 추적해서 간단하게 지정했다.
→ stage ai 토론게시판을 잘 살펴보자
오늘의목표
- 토론게시판 5개 읽어보기
- 데이터셋 데이터로더 구성하기
Day03
현황공유
- 지훈
- 기본적인 cnn으로 40epoch를 돌려서 시도 중
- 범진
- pretrained를 사용해서 훈련해보니까 훨씬잘나온다
- 민식
- 어떤 pretrained를 사용할지 고민중이고 아직 training전
- 서윤
- dataset과 loader를 어제 생성, 예시코드보고 수정 중 → 오늘안에 제출예정
- 질문
- os.listdir()이 받아오는순서는?
- Dataset과 loader가 어떻게해야 loading이 효율적인지
- 경재
- 어제 해본거에 hyper parameter를 변경하며 성능개선중
- 오늘은 augmentation을 사용해서 시도해볼예정
- 상우
- 어제 공부한 상황으로 아직 이해가 덜 됐지만, 오늘 본인의 코드로 만들 예정
- 대희
- Dataset Dataloader를 완성했다.
- 정답코드를 보고 개선할 예정
- 모델은 vit를 사용했지만 성능이 좋지않다 → 원인분석중
경재님이 만들어준 템플릿을 사용한다
다음주를 미리 대비
- Data Set, Data Loader
- 최적화 하는방법
Day04
경재님이 올려주신 코드 확인
여러모델을 돌려보자
조를 이루고 1인당 1번의 제출, 팀제출 3번
git 사용법 공부
- Kaggle 데이터를 활용하여 Model을 학습하고 -> 우리 Train data를 평가 데이터로 활용하여 labeling을 다시 진행해보기
- Pre-trained Model 성능 정리
- 대회 데이터에서 Augmentation 기법 중 성능이 좋은 것은?
- Github 코드에 K-fold, Early Stopping 적용