[부스트캠프] Day 75 회고

Gamchan Kang·2024년 12월 4일
0

10:00 ~ 13:00

어제 밤에 코드 정리를 하다가 LCEL(LangChain Expression Language)를 처음 알게 됐다. 정확히는 | 연산자로 체인을 구성하는 건 얼추 알고 있었지만, 여러 개 파이프라인을 하나로 이어 붙이는 방법은 몰랐다. 실험 모듈을 하나의 파이프라인으로 구성하려고 했는데 이를 활용해야 겠다고 생각했다. 특히 RunnableSeriable 객체와 파이프라인을 구성하는 Langchain 객체를 공부해야겠다고 생각했다.

13:00 ~ 16:00

프로젝트 랩업 리포트 초안을 작성하면서 참고 자료를 찾아봤다. 실험 단계에서 자료를 찾지는 못했지만, 랩업 리포트에서 실험 결과와 제언을 작성할 때 참고할 자료를 찾았다. 자료를 찾으면서, 시간에 쫓겨 하지 못했던 자료 조사가 얼마나 중요한지 알게 됐다. 실험하면서 경험적으로 발견했던 문제점을 많이 찾았고, 내 생각이 옳은지 판단이 안 설 때 참고할 만 했던 자료도 많이 있었다. 다음 프로젝트에서는 자료 조사에 시간을 할애하는 것이 절대 돌아가는 점이 아님을 명심해야겠다.

16:00 ~ 19:00

다른 조의 발표를 들으니, 데이터 분석에서 우리 조 프로젝트와 많이 다르다고 생각했다. KMMLU, MMMLU, KLUE MRC로 구성된 데이터셋을 분리할 생각을 하지 못 했는데, 데이터셋이 어떻게 구성되었는지, 어떻게 증강할 수 있는지, 실제 목표와 어떻게 다른지 인사이트가 부족했다. 모델링도 중요하긴 하지만, LLM을 사용하는 테스크인만큼 데이터 구성을 어떻게 할 지가 중요하다고 생각이 들었다.

profile
Someday, the dream will come true

0개의 댓글