[SIG 프로젝트] 1. QA시스템을 만들어보자

조우성·2021년 7월 13일
0

이번 21년도 여름방학에는 팀원 2명과 함께 한국사 QA시스템을 만들어보기로 하였다.
지금하는 이 프로젝트는 2학기 과목에서 쭉 이어갈 예정이기 때문에 구현가능성과 데이터의 수집가능성을 따져보아서 정한 주제이다

처음에는 한국사 시험을 타겟으로 하고 진행하려 했으나, 데이터 수집이 너무 어려웠고, 데이터 가공이 매우 힘들었기에 포기했다.
그래서 타겟층의 연령을 확실히 낮춰 유아~초등학생 기준으로 진행하려고 한다.

현재 목표는 총 두가지다.

첫 번째는 간단한 한국사 질문에 대한 답을 찾아주는 것.
이는 BERT와 질의응답 데이터 셋인 KorQuad를 활용해서 먼저 파인튜닝한 모델을 만들 생각이다.

두 번째는 어린 아이들이 흥미를 쉽게 가질 수 있도록 퀴즈를 제공하는 것.
이때 이 퀴즈는 관리자가 직접 만드는 것이 아닌 자동으로 생성되게 할 것이다.

한국사 데이터는 한국민족문화대백과사전(http://encykorea.aks.ac.kr/)에서 수집할 생각이다.

이런식으로 15개의 유형으로 분류를 잘 해 두어서 그대로 수집할 생각이다.

0개의 댓글