[논문 리뷰] Training Language Models to Follow Instructions with Human Feedback (InstructGPT)

우징어·2024년 1월 17일

LLM language reinforcement learning transformer transformers 논문 리뷰

0

논문 리뷰

목록 보기

41/43

ㅇㅅㅇ

안녕하세요, AI를 좋아하는 AI 엔지니어입니다

이전 포스트

[논문 리뷰] Rethinking the Role of Demonstrations: What Makes In-Context Learning Work?

다음 포스트

[논문 리뷰] Llama 2: Open Foundation and Fine-Tuned Chat Models

0개의 댓글