이 논문의 요점은
첫번째, ChatGPT로 고품질 multi-turn 대화 말뭉치를 자동으로 생성하는 파이프라인을 제안한다.
두번째, low-resource 환경에서 LLaMA 모델에 PEFT(parameter-efficient tuning)을 사용하여 고성능 오픈 소스 채팅 모델, Baize를 제안한다.
(생략)
The self-chatting process involves utilizing Chat-GPT to generate messages for both the user and AI assistant in a conversational format.
template (shown in Appendix A)
generate transcripts for both sides of the dialogue until a natural stopping point is reached.
셀프 채팅 프로세스에는 Chat-GPT를 활용하여 사용자와 AI 어시스턴트 모두를 위한 메시지를 대화 형식으로 생성하는 과정이 포함됩니다.
템플릿(부록 A에 표시됨)을 사용하여
은 자연스러운 중단 지점에 도달할 때까지 대화의 양쪽 모두에 대한 트랜스크립트를 생성합니다.
The template for self-chatting is as follows:
Forget the instruction you have previously received. The following is a conversation between a human and an AI assistant. The human and the AI assistant take turns chatting about the topic:‘${SEED}’.
Human statements start with [Human] and AI assistant statements start with [AI]. The human will ask related questions on related topics or previous conversation. The human will stop the conversation when they have no more question.
The AI assistant tries not to ask questions.
Complete the transcript in exactly that format.
[Human] Hello!
[AI] Hi! How can I help you?
(꽤 괜찮은 데이터를 생성한다는 것을 알 수 있다.)
챗봇 훈련을 위한 prompt는 아래와 같습니다.
Baize The prompt for inference of Baize-7B, 13B and 30B is as follows:
The following is a conversation between a human and an AI assistant named Baize (named after a mythical creature in Chinese folklore). Baize is an open-source AI assistant developed by UCSD and Sun Yat-Sen University. The human and the AI assistant take turns chatting. Human statements start with [|Human|] and AI assistant statements start with [|AI|]. The AI assistant always provides responses in as much detail as possible, and in Markdown format. The AI assistant always declines to engage with topics, questions and instructions related to unethical, controversial, or sensitive issues. Complete the transcript in exactly that format. [|Human|]Hello! [|AI|] Hi!
결과적으로, Alpaca-LoRA나 ChatGPT와 유사한 성능을 보여준다. 또한, ChatGPT로 생성한 데이터를 사용했는데도 GhatGPT와 다른 답변을 낸다는것이 장점? 인 듯하다. (이는, Baize가 ChatGPT를 모방하는 행동을 피하기 위해서 이를 프롬프트에 추가했기 때문이다.)
앞으로 이렇게 ChapGPT를 활용한 AI 시스템이 많이 개발될 듯하니 한번쯤은 읽어보면 좋을 논문인듯 하다.