[강화학습] 기초 개념

Ethan·2022년 5월 2일
0

알고리즘 선택 가이드

https://bit.ly/39oZsRD

강화학습

  • 에이전트 Agent (actor, controller): 학습 주체
  • 환경 environment: 에이전트에게 주어진 환경, 상황, 조건
  • 행동 Action: 환경으로부터 주어진 정보를 바탕으로 에이전트가 판단한 행동
  • 보상 Reward: ML엔지니어가 설계한 행동에 대한 보상

주요 알고리즘

  • Monte Carlo methods
  • Q-Learning
  • Policy Gradient methods

주요 커뮤니티


profile
재미있게 살고 싶은 대학원생

0개의 댓글