affordance와 constraint
를 출력affordance와 constraint
를 3D value map에 grounding함.affordance maps
와 constraint maps
를 의미함.objective function으로 쓰임!
motion trajectory τir
를 생성하는 것이다.motion trajectory τir
은 end-effector waypoints의 dense waypoints를 의미6-DoF end-effector pose
, end-effector velocity
, and gripper action
을 포함 (Operational Space Controller [117]에서)motion trajectory τir
를 찾는 것.)마지막으로 비디오 추적기 XMEM [119]을 사용하여 마스크를 추적
평면 밀기 모델
만 연구무작위 샷팅을 사용하여 행동 매개변수를 최적화
수행할 작업이 복잡
하거나, 특정 동작을 미리 정의하기 어려운 경우
실시간으로 궤적을 최적화해야 하는 경우.
프리미티브 선택:
매개변수 설정:
프리미티브 실행:
작업 분석:
경로 계획 및 최적화:
실시간 재계획:
LLM을 사용하는 Code as Policies [75]의 변형
과 비교 시뮬레이션에서의 일반화를 연구
일반화에 대한 엄격한 정량적 평가를 제공하기 위해, 우리는 실제 로봇 설정을 반영하는 시뮬레이션된 블록-월드 환경을 설정했음
각 작업은, 사전 정의된 목록에서 선택된 무작위 attribute을 포함하는 템플릿 지시(예: “객체 [obj]을/를 [pos]로 밀기”)를 포함
세부 사항은 부록 A.5에 있습니다.
"객체 [obj]을/를 [pos]로 밀기" 같은 지시가 프롬프트에 포함될 수 있습니다.(또는 supervised baseline의 학습 데이터에 나타날 수 있음).
작업은 2개의 범주로 그룹화됩니다.
baseline으로,
LLM은 어포던스와 제약 조건에 대해 명시적으로 추론함으로써 더 잘 일반화됩니다.
한편, 원시 프리미티브 매개변수를 직접 지정하는 것보다,
더 견고한 인식 파이프라인
과 물리적으로 현실적인 동적 모델
을 사용하는 것이 전체 성능 향상에 기여할 수 있음을 발견했습니다. 전체적인 시각적 추론
이나 세밀한 객체 기하학의 이해가 필요한 작업
에 제한적