본 게시물은 가톨릭대학교 인공지능 팀프로젝트 wumpus world를 구현한 과정이다. 구체적인 코드 및 자료는 github 참고하면 된다.
Wumpus World 이해를 돕는 사이트
Wumpus world에 대한 동작과정 설명은 위 사이트를 참고하면 된다. 구체적인 설명은 생략하겠다.
: 도메인 분석 > 휴리스틱 결정(a*를 기본으로 가정하고 다른 휴리스틱과 성능 비교) > 논리적 추론 방법 결정(불완전 정보를 다루는 방법과 안전한 경로 선택 방법 등에 대한 고민이 필요) > 도메인과 객체 매핑 > UI 제작 > 구현(클래스 설계) > 최적화 및 발표 준비
노션을 통해 회의 및 기록을 남겼다.
Agent 이동 로직 구현 및 에이전트의 상태 A*알고리즘 구현 및 KB를 Percept하고 에이전트가 KB의 정보를 가지고 판단 할 수 있도록 구현했다.
이 사진을 참고하여 보면 에이전트 동작과정을 직관적으로 이해하기 쉽다.
시뮬레이션이 진행됨에 따라 에이전트의 전체 성능이 시뮬레이터 화면 하단에 파란색으로 표시한다. 보상을 극대화하려면 에이전트가 성공적으로 보물을 움켜쥐고 시작 위치로 돌아와 동굴 밖으로 나와야한다. 그러나 보물을 얻는 것이 불가능한 환경(예: 금이 구덩이에 둘러싸여 있는 경우)이 있으므로 에이전트는 포기하고 빈손으로 떠날 수 있을 정도로 똑똑해야 한다.
+1000 에이전트가 금을 가지고 동굴 밖으로 나올 경우.
-1 에이전트가 수행하는 각 작업에 대해 수행합니다(화살표 발사 제외).
-10 화살 쏘기.
-1000 구덩이에서 떨어지거나 혹에 잡아먹힐 경우.
테스트 시나리오는 팀프로젝트 최종본 보고서를 기반으로 작성했다.
자세한 질문 및 코드는 github를 참고하세요
https://github.com/Ohsaam/WumpusWorld-AI
정말 쉽지않았습니다..
강화학습 복습하려고 구글링하다가 여기까지 닿았네요. 그때 같이 진행했던 프로젝트 깔끔하게 정리하신거 잘 보고갑니다bb