4주차 피어세션 정리

Sangwoo Bae·2021년 8월 27일

week04 부스트캠프

0

Day01

Set team random seed

Random seed = 25

Set random seed

SEED = 25
random.seed(SEED)
np.random.seed(SEED)
os.environ["PYTHONHASHSEED"] = str(SEED)
torch.manual_seed(SEED)
torch.cuda.manual_seed(SEED) # type: ignore
torch.backends.cudnn.deterministic = True # type: ignore
torch.backends.cudnn.benchmark = True # type: ignore

Today Mission

간단한 데이터 접근 ( 주어진 데이터의 세분화 된 category 분포 확인 )
Special mission 채워보기
Data Loader 작성

Day02

EDA

train 데이터의 주어진 양이 고르지않다

DataSet DataLoader

이미지 path
- 전처리로 이미지 확장자 변환을하고 파일명을 고정시켜서 path를 지정한 경우와 os.listdir로 수시로 받아와서 이미지 path를 지정한 경우가 있었다.
데이터 라벨
- 데이터라벨을 if else로 다 때려박는 방법과 라벨을 지정하는 방법을 추적해서 간단하게 지정했다.

→ stage ai 토론게시판을 잘 살펴보자

오늘의목표

토론게시판 5개 읽어보기
데이터셋 데이터로더 구성하기

Day03

현황공유

지훈
- 기본적인 cnn으로 40epoch를 돌려서 시도 중
범진
- pretrained를 사용해서 훈련해보니까 훨씬잘나온다
민식
- 어떤 pretrained를 사용할지 고민중이고 아직 training전
서윤
- dataset과 loader를 어제 생성, 예시코드보고 수정 중 → 오늘안에 제출예정
- 질문
  - os.listdir()이 받아오는순서는?
  - Dataset과 loader가 어떻게해야 loading이 효율적인지
경재
- 어제 해본거에 hyper parameter를 변경하며 성능개선중
- 오늘은 augmentation을 사용해서 시도해볼예정
상우
- 어제 공부한 상황으로 아직 이해가 덜 됐지만, 오늘 본인의 코드로 만들 예정
대희
- Dataset Dataloader를 완성했다.
- 정답코드를 보고 개선할 예정
- 모델은 vit를 사용했지만 성능이 좋지않다 → 원인분석중

경재님이 만들어준 템플릿을 사용한다

다음주를 미리 대비

Data Set, Data Loader
최적화 하는방법

Day04

경재님이 올려주신 코드 확인

여러모델을 돌려보자

조를 이루고 1인당 1번의 제출, 팀제출 3번

git 사용법 공부

각자의 branch를 사용했음

Kaggle 데이터를 활용하여 Model을 학습하고 -> 우리 Train data를 평가 데이터로 활용하여 labeling을 다시 진행해보기
Pre-trained Model 성능 정리
대회 데이터에서 Augmentation 기법 중 성능이 좋은 것은?
Github 코드에 K-fold, Early Stopping 적용

:)

이전 포스트

week03 pytorch 정리

다음 포스트

4주차 강의내용 정리

0개의 댓글