저번 포스팅에선 NLU, NLG에서 각각 하나씩 sub task를 선정하여 알아보았다.
이번 포스팅에선 NLU 중 Question Answering(QA)에 대해 다루고자 한다.
자연어이해 (natural language understanding) 한국어 또는 영어와 같이 일반적으로 의사소통에 쓰이는 수많은 언어를 자연어라 하며, 어떠한 것을 이해 한다는 것은 한 표현(근원표현)으로부터 다른 표현(목적표현)으로 변환시키는 것을 뜻한다.
-위키백과-
Question answering (QA) is a computer science discipline within the fields of information retrieval and natural language processing (NLP), which is concerned with building systems that automatically answer questions posed by humans in a natural language.
-위키백과-
앞서 언급했듯, QA는 인간의 질문에 답변하는 모델을 설계하는 것이 최종 목표이다.
지난 게시글에 포스팅했던 Dialogue Generation(DG)과 다루는 문제는 비슷한 듯 하여 두 task 간의 차이점을 고민해보았다.
기본적으로, 각각 NLU(Understanding)과 NLG(Generation)에 속한다는 점에서 착안하여 비교한다.
이렇듯, '상대의 질문에 응답'이라는 동일한 문제를 해결하면서 약간의 차이를 가지는 것을 알 수 있다.
SQuAD(Stanford Question Answering Dataset)는 QA task에서 자주 사용되는 데이터셋이다.
특징은 다음과 같다.
Text-To-Text Transfer Transformer(T5)의 배경 및 메인 아이디어에 대해 알아본다.
배경
메인 아이디어
확실히 T5가 NLU 분야에서 많이 사용되고 있다는 사실을 알고 갑니다. 좋은 글 잘 읽었습니다!