데일리 스크럼을 진행하면서 어제 생각한 내용을 공유했다. 현재 프로젝트 규모에 비해 인원이 너무 많아서 역할이 겹친다고 생각했다. 프로젝트 규모를 운영진이 의도한 바보다 더 확장해서 진행하면 많이 공부할 수 있지 않을까 싶었다. 팀원들은 좋긴 한데 아직은 준비가 부족하다고 생각한다는 의견이었다. 서버 4대가 제공되니 이를 잘 활용하는 방법을 생각해봐야겠다.
한국어-일본어-한국어 RTT를 시도해봤다. facebook/mbart-large-50을 사용했다. 한국어-일본어 번역 모델이 찾기가 어려웠다. m2max 칩으로 가속했는데도 간단한 문장 rtt 작업이 모델 첫 로드 시 30초 가량, 로드된 모델 활용 시 2~3초 걸렸다. 생각보다 오래걸려서 다른 모델을 찾아보거나, 아예 다른 방안을 찾아야겠다.
13:00 ~ 16:00
서버에서 다른 팀원이 짠 코드를 처음으로 돌려봤다. 예상보다 세팅에서 시간이 오래 걸렸는데, 우선 어제 세팅한 깃헙 레포 연동이 자주 끊어졌다. 왜 그런지 원인을 파악하고 수정하고 싶지만, 다음으로 미루기로 했다. 서버에는 이미 conda가 설치되어 있어 비교적 쉽게 환경을 구성했다. 그 이후 vscode에서 주피터 익스텐션으로 세팅하려고 했으나, 계속 vscode에서 인식하지 못했다. 서버 내부에 익스텐션이 설치되어야 하는데, 버튼 하나만 누르면 해결되는 문제였다. 원격 서버 환경에 좀 익숙해질 필요가 있다.
RoBERTa를 15 에폭으로 돌렸는데, v100 서버에서 70분이 걸렸다. 하이퍼파라미터를 바꿔가며 실험하고 싶은데, EDA를 먼저 진행하고 본격적으로 들어가려고 한다.