squiduu.log
로그인
squiduu.log
로그인
[논문 리뷰] Training Language Models to Follow Instructions with Human Feedback (InstructGPT)
우징어
·
2024년 1월 17일
팔로우
0
LLM
language
reinforcement learning
transformer
transformers
논문 리뷰
0
논문 리뷰
목록 보기
41/43
ㅇㅅㅇ
우징어
안녕하세요, AI를 좋아하는 AI 엔지니어입니다
팔로우
이전 포스트
[논문 리뷰] Rethinking the Role of Demonstrations: What Makes In-Context Learning Work?
다음 포스트
[논문 리뷰] Llama 2: Open Foundation and Fine-Tuned Chat Models
0개의 댓글
댓글 작성