Hugging Face AutoTrain GUI 이용 (Nocode)

Gongsam·2025년 3월 21일
0

project

목록 보기
2/3

시도

  • 허깅페이스에서 파인튜닝 실행: 사용한 데이터(modified.csv) → 자기소개서 - JD 가 Fit한지 여부를 세 가지 라벨링으로 분류하도록 학습

    • 이렇게 학습시킨 모델이 피드백 생성도 담당하도록 할 수 있는지?

    • 아니면 라벨링 하는 모델이 있고(Hugging Face 상 Autotrain의 ST Fair Classification) → 라벨링을 토대로 데이터셋 재구성(Hugging Face 상 Autotrain의 ST Quset - Answer 형태로) → ST 모델에 다시 학습시키고 → 이 모델을 사용하기?

  • modified.csv를 한국어로 변환해봤는데 google translator 성능 별로임

문제 상황

데이터셋 문제

  • 허깅페이스의 Autotrain GUI를 사용해봄
    • 허깅페이스의 데이터 허브에 올라와 있는 거 사용해보려고 했는데 path 지정을 어떻게 하는지 모르겠고 train split 칸에 뭘 쓰라는지 모르겠어서 그건 못씀
    • 애초에 데이터 허브의 데이터를 바로 쓸 수도 없었던 게 Autotrain의 ST Pair Classification이 요구하는 데이터셋 형식과 달랐음
      • 요구하는 데이터셋 형태: sentence 1, sentence 2, label
      • 그래서 적절한 데이터 다운 받고 -> label을 숫자로 변환 후 -> 로컬로 업로드
      • 이러고 새로고침해서 실행했더니 잘 되는 중

ST Pair classification로 학습시켰으나.. SentenceTransformer로 저장되는 문제

  • 의도는 AutoModelForSequenceClassification로 저장하는 거였는데 Auto 파인튜닝한 원래 모델의 형식과 같게 저장된다 함 그래서 SentenceTransformer로 저장됐고 임베딩만 수행...
    • 그럼 task를 왜 설정하게 하는 거지?..
      • 최적화된 학습을 위한 것이지 이걸로 인해서 분류 모델로 저장되거나 하는 건 아니라고 함. 그렇기 때문에 GUI를 쓰는 게 아니라 직접 코드를 짜야 한다 😊...
profile
🐬 파이썬 / 인공지능 / 머신러닝

0개의 댓글