어제 밤에 코드 정리를 하다가 LCEL(LangChain Expression Language)를 처음 알게 됐다. 정확히는 |
연산자로 체인을 구성하는 건 얼추 알고 있었지만, 여러 개 파이프라인을 하나로 이어 붙이는 방법은 몰랐다. 실험 모듈을 하나의 파이프라인으로 구성하려고 했는데 이를 활용해야 겠다고 생각했다. 특히 RunnableSeriable
객체와 파이프라인을 구성하는 Langchain 객체를 공부해야겠다고 생각했다.
프로젝트 랩업 리포트 초안을 작성하면서 참고 자료를 찾아봤다. 실험 단계에서 자료를 찾지는 못했지만, 랩업 리포트에서 실험 결과와 제언을 작성할 때 참고할 자료를 찾았다. 자료를 찾으면서, 시간에 쫓겨 하지 못했던 자료 조사가 얼마나 중요한지 알게 됐다. 실험하면서 경험적으로 발견했던 문제점을 많이 찾았고, 내 생각이 옳은지 판단이 안 설 때 참고할 만 했던 자료도 많이 있었다. 다음 프로젝트에서는 자료 조사에 시간을 할애하는 것이 절대 돌아가는 점이 아님을 명심해야겠다.
다른 조의 발표를 들으니, 데이터 분석에서 우리 조 프로젝트와 많이 다르다고 생각했다. KMMLU, MMMLU, KLUE MRC로 구성된 데이터셋을 분리할 생각을 하지 못 했는데, 데이터셋이 어떻게 구성되었는지, 어떻게 증강할 수 있는지, 실제 목표와 어떻게 다른지 인사이트가 부족했다. 모델링도 중요하긴 하지만, LLM을 사용하는 테스크인만큼 데이터 구성을 어떻게 할 지가 중요하다고 생각이 들었다.