2023년도에 개봉한 시게루짱의 수퍼마리오 브라더스의 나무위키 일부분이다.
이걸 가지고 데이터를 만들어 보겠다.
총 713개의 질문과 답변 생성
모델은 exaone3.5:7.8b 을 사용하였다.
소스는 이전과 동일하니 패스.
만든 질답 데이터로 학습을 실시한다.
학습 대상은 아무것도 모르는 TinyLlama-1.1B-Chat-v1.0 로 하겠다.
주요 목표는 세상을 지키는(x) 루이지를 구하고 세상을 지키는(o)
쿠파의 목적은 끝에가 좀 잘렸지만 정답이다.
학습된 모델의 대답이 틀리지는 않았지만 조금 부족했다. Instruction dataset 을 만들 때 좀더 간결하게 만들어야 하지 않았나 생각이 든다. 700개 가지고는 택도 없었다 라는 의미