VO / 상호 작용 속도 장애물(RVO)
의 개념: https://velog.io/@jk01019/Velocity-ObstacleVO "RVO 영역 및 예상 충돌 시간(TTC)" 기반 보상 함수
의 개념제한된 주변 정보 하에서 상호 충돌 회피 주행을 달성
주변 로봇과 장애물의 정보를 RVO 및 VO 벡터로 각각 표현하여 (장애물과의 상호 작용 환경을 표현하는) 통일된 environment state representation을 달성
(network input으로 쓰임)중앙 집중식
과 분산식 방법
의 두 가지 유형 로봇의 수가 증가함에 따라 중앙 집중식 시스템은 더 많은 계산 예산이 필요
하며, 각 개별 로봇과 중앙 제어기 사이의 신호 지연이나 불안정성으로 인해 문제가 발생
할 수도 있습니다.비홀로노믹 ORCA(Non-Holonomic ORCA, NH-ORCA)
는 ORCA와 운동 모델을 결합하여 비홀로노믹 제약 조건 하
에서 ORCA 성능을 보장합니다. 가우스 불확실성을 극복하기 위해 RVO의 확률적 변형(PRVO)을 제안
합니다. 에이전트 수준 DRL 접근법
은 원시 센서 데이터가 아닌 환경 모델을 사용하여 센서 모드와 운동/동적 세부 정보에 대한 높은 계산 효율성과 유연성을 달성
로봇의 위치와 속도 대신 RVO 벡터를 입력으로 사용
합니다. 양방향 GRU 기반 신경망은 주변 로봇의 수가 변하는 상태를 직접적으로 연속적인 행동으로 매핑하도록 설계되어 저비용 계산을 달성
내 로봇에 대한 정보에는 로봇 반경, 현재 속도, 현재 방향 및 원하는 속도가 포함
주변 로봇의 정보는 로봇 반경, 상대 위치 및 속도로 구성
되며, 이는 RVO 벡터를 통해 나타낼 수 있습니다.
정적 선 장애물도 VO 벡터를 통해 나타낼 수 있습니다.
이러한 벡터는 충돌 회피 정책을 훈련하기 위해 신경망에 공급됩니다. 현재 속도에서의 VO 영역과 예상 충돌 시간을 기반으로 상태와 행동을 평가하는 데 도움이 되는 보상 함수
가 설계되었습니다. 출력
은 각 시간 단계에서 현재 속도의 증분, 즉 현재 속도의 변화율
입니다. 최고 목표 속도
, 충돌회피를 위한 가상 반지름 길이
(로봇 크기)다른 동적 agents와의 RVO (상대 agent의 속도를 추가한 개념)
다른 agents들의 상대 위치 정보
는 빼도 됨.다른 동적 agent와의 TTC(상대 agent의 속도를 추가한 개념)