World model training: Variational Autoencoder 또는 LSTM 레이어가 있는 신경망과 같은 세계 모델에 대한 신경망 아키텍처를 정의합니다.입력 데이터(예: 이미지, 작업)를 전처리하고 역전파를 사용하여 재구성 오류를 최소화하고 예측 보
AI가 상위개념, 머신러닝과 딥러닝이 하위개념이라고 볼 수 있다.머신러닝에는 크게 지도학습, 비지도학습, 그리고 강화학습이 있는데 이번에는 강화학습이 뭔지 알아보려고 한다. 강화학습은 machine learning의 한 방식으로, Agent라는 학습의 주체가 환경과 상
Background Artificial agent가 목표를 달성하기 위해 행동을 선택할 수 있는 방법에 대한 연구는 강화 학습(RL)의 활용으로 인해 상당 부분 급속한 진전을 이루고 있습니다. 시행착오를 통해 성공적인 행동을 예측하는 RL에 대한 model-free
커다란 RNN 기반의 에이전트를 학습할 수 있느냐RNN 같은 경우, 사이즈가 커지게 되면 hyperparameter 숫자가 많아지면서 트레이닝 하기 어렵고 vanishing gradient (학습한 것을 잊어버림) 문제가 발생한다.월드모델은 이런 고민에서부터 시작에이전