4주차 피어세션 정리

Sangwoo Bae·2021년 8월 27일
0

Day01

Set team random seed

  • Random seed = 25

    Set random seed

    SEED = 25
    random.seed(SEED)
    np.random.seed(SEED)
    os.environ["PYTHONHASHSEED"] = str(SEED)
    torch.manual_seed(SEED)
    torch.cuda.manual_seed(SEED) # type: ignore
    torch.backends.cudnn.deterministic = True # type: ignore
    torch.backends.cudnn.benchmark = True # type: ignore

Today Mission

  • 간단한 데이터 접근 ( 주어진 데이터의 세분화 된 category 분포 확인 )
  • Special mission 채워보기
  • Data Loader 작성

Day02

EDA

  • train 데이터의 주어진 양이 고르지않다

DataSet DataLoader

  • 이미지 path
    • 전처리로 이미지 확장자 변환을하고 파일명을 고정시켜서 path를 지정한 경우와 os.listdir로 수시로 받아와서 이미지 path를 지정한 경우가 있었다.
  • 데이터 라벨
    • 데이터라벨을 if else로 다 때려박는 방법과 라벨을 지정하는 방법을 추적해서 간단하게 지정했다.

stage ai 토론게시판을 잘 살펴보자

오늘의목표

  • 토론게시판 5개 읽어보기
  • 데이터셋 데이터로더 구성하기

Day03

현황공유

  • 지훈
    • 기본적인 cnn으로 40epoch를 돌려서 시도 중
  • 범진
    • pretrained를 사용해서 훈련해보니까 훨씬잘나온다
  • 민식
    • 어떤 pretrained를 사용할지 고민중이고 아직 training전
  • 서윤
    • dataset과 loader를 어제 생성, 예시코드보고 수정 중 → 오늘안에 제출예정
    • 질문
      • os.listdir()이 받아오는순서는?
      • Dataset과 loader가 어떻게해야 loading이 효율적인지
  • 경재
    • 어제 해본거에 hyper parameter를 변경하며 성능개선중
    • 오늘은 augmentation을 사용해서 시도해볼예정
  • 상우
    • 어제 공부한 상황으로 아직 이해가 덜 됐지만, 오늘 본인의 코드로 만들 예정
  • 대희
    • Dataset Dataloader를 완성했다.
    • 정답코드를 보고 개선할 예정
    • 모델은 vit를 사용했지만 성능이 좋지않다 → 원인분석중

경재님이 만들어준 템플릿을 사용한다

다음주를 미리 대비

  • Data Set, Data Loader
  • 최적화 하는방법

Day04

경재님이 올려주신 코드 확인

여러모델을 돌려보자

조를 이루고 1인당 1번의 제출, 팀제출 3번

git 사용법 공부

  • 각자의 branch를 사용했음
  1. Kaggle 데이터를 활용하여 Model을 학습하고 -> 우리 Train data를 평가 데이터로 활용하여 labeling을 다시 진행해보기
  2. Pre-trained Model 성능 정리
  3. 대회 데이터에서 Augmentation 기법 중 성능이 좋은 것은?
  4. Github 코드에 K-fold, Early Stopping 적용

0개의 댓글