[부스트캠프] Day 52 회고

Gamchan Kang·2024년 10월 29일
0

10:00 ~ 13:00

강의를 들었다. Data-centric NLP와 관련된 내용이었다. 흐름이 있긴 했지만 파편적인 용어가 많이 있어 암기에 가까운 내용이었다. 개론과 흡사해서 그런 것 같다. 매우 방대한 내용이라고 생각이 든다.

13:00 ~ 16:00

계속 강의를 듣고 있다. 빨리 강의를 듣고 플젝에 참여해야겠다.

16:00 ~ 19:00

플젝 회의를 간단하게 했다. 데이터 이상치 종류가 많았지만, 어떻게 접근해야 할지 막막했다. 원본 데이터가 뭔지 모를 정도로 훼손된 경우도 있었다. 우선, 어떻게 데이터 이상을 분류할 것인지, 그리고 각 이상치를 어떻게 다룰 것인지가 궁금하다.

크게 따지면 노이즈가 낀 데이터와 라벨이 잘 못된 데이터가 있다. 라벨이 잘 못된 데이터는 어떻게 이상치를 알아차릴지 모르겠다. 클러스터링 기반 데이터 이상치 감지 방법이 있지만, 데이터 이상치를 감지하는 행위가 이미 테스크를 해결하지 않았나라는 생각이 든다. 마치 돈이 없어 배가 고픈데 밥을 먹으라는 이야기처럼 들렸다. 내가 지금 무언가를 단단히 착각하고 있다는 생각이 들었다.

새로운 팀원으로 현재 팀원 한 명이 더 들어온다고 했다. 현재 꾸려진 팀원과 나, 그리고 들어오겠다는 현재 팀원이 다 같이 만났다. 무엇이 좋은 팀원인가? 항상 물어야하는 질문이고 내가 어떻게 해야하는지 나오는 질문이다.

profile
Someday, the dream will come true

0개의 댓글