이번 프로젝트 주제는 Open-domain QA이다. 나는 처음 경험해보는 분야인데, 너무 간단하게 생각했었다. '그냥 외부 문서 API 끌어다가 LLM 파이프라인 구성해서 답변을 내 놓으면 되지 않을까?'라고 말이다. 하지만 데이터셋과 채점 방식을 뜯어보니 그것을 원
강의 내용을 1강부터 꼼꼼히 보고 있다. 프로젝트에서 Exact Match를 모델 평가 기준으로 두는 이유가 궁금했다. 내 생각에는 Exact Match가 평가지표가 된 모델은 범용성이 떨어질 것 같다.추가: 조교님으로 부터 다음과 같은 답변을 받았다EM이 명확하고,
어제 밤에 팀 동료를 만나러 진주에 왔다. AI 엔지니어 중에 나와 비슷한 생각을 찾고 싶어서 반드시 만나야겠다고 생각했다. 일과 시작 전에 10분 정도 이야기를 나눴는데 평소에 고민을 많이 했던 걸로 보였다. 비슷한 고민을 하고 있어서 동질감을 느꼈다.Dataset.
16:00 ~ 19:00
각자 retrieval과 reader 중 어떤 역할을 맡을 지 논의했다. 나는 reader를 골랐다. 이후 베이스라인 코드를 분석해온 다른 팀원들의 이야기를 들었다. 확실히 베이스라인 코드가 복잡하게 짜여있었다. 왜 그렇게 짰을까... 이후 각 팀별로 어떻게 세부적으로