어제 밤에 팀 동료를 만나러 진주에 왔다. AI 엔지니어 중에 나와 비슷한 생각을 찾고 싶어서 반드시 만나야겠다고 생각했다. 일과 시작 전에 10분 정도 이야기를 나눴는데 평소에 고민을 많이 했던 걸로 보였다. 비슷한 고민을 하고 있어서 동질감을 느꼈다.
Dataset.map, DatasetDict.map 함수에 대해서 조사했다. 공식 문서 설명을 번역하는데 map 함수가 정말 강력하다는 것을 발견했다. 특히 분산 처리에서도 map이 사용될 수 있는지 처음 알았다. RoBERTA를 이용한 데이터 증강 코드가 매우 간단하게 구성돼서 아쉬웠다. 이번 프로젝트에는 반드시 적용하겠다고 생각했다.
과제 2를 완료했다. 과제 1에 비해서는 난이도가 쉬웠다. 허깅페이스에 있는 다양한 함수를 이해할 필요가 있다!
멘토님이 바뀌고 첫 멘토링을 했다. 궤도와 우주먼지와 아는 사이라고 한다. 가고 싶었던 랩실인 이교구 교수님 랩실에서 석박을 하셨다고 한다. 정말 커리어가 화려하신 분이었다. 그리고 유쾌하신 분이었다. 멘토님 소개 이후 팀원들끼리 돌아가면서 소개했다. 다시 듣는 이야기를 소개할 줄 알았지만, 다들 좀 더 자기를 드러내며 소개했다. 새롭게 듣는 이야기가 많았다. 이야기를 들어보고 싶다는 생각이 들었다.
3시 멘토링 4시 반 피어세션 5시 마스터 클래스를 하니 시간이 모자라 6시에 추가로 회의를 진행했다. 각자 조사한 허깅페이스 도구를 발표했다. 기타 허깅페이스 hub나 다른 내용이 아닌, 학습과 관련된 내용을 위주로 발표하는데도 내용이 참 많다고 느껴졌다. 조사하면서도 잘 정리된 문서와 내용이 알차 많이 참고해야 겠다.