[e2e] GenAD: Generative End-to-End Autonomous Driving

About_work·2024년 11월 18일
0

[AD] LLM / vlm

목록 보기
2/5

GenAD: 새로운 세대의 자율주행 기술 소개

  • 최근 자율주행 분야에서, 카메라와 같은 비전 센서를 이용하여 직접 주행 계획을 생성하는 방법이 큰 관심을 받고 있습니다.
  • 하지만 기존의 대부분의 자율주행 시스템은 인지(perception), 움직임 예측(motion prediction), 그리고 계획(planning)을 단계별로 처리하는 방식으로 구성되어 있습니다.
    • 이러한 방식은 전체적인 교통 상황의 변화, 즉 자율주행 차량과 주변 차량 간의 미래 상호작용을 완벽히 모델링하지 못하는 한계가 있습니다.
    • 미래 상호작용의 부족한 고려:
      • 자율주행 차량의 행동이 주변 차량에 미치는 영향, 그리고 그에 따른 다시 자율주행 차량에 미치는 영향(즉, 고차 상호작용)을 충분히 반영하지 못합니다.
    • 경로의 구조적인 특성 미반영:
      • 미래의 경로는 일정한 패턴이나 구조를 가지고 있지만, 기존 방법은 이러한 구조적인 특성을 충분히 고려하지 못해 부정확한 예측과 계획을 초래할 수 있습니다.
  • 이 글에서는 이러한 문제를 해결하기 위한 새로운 접근법인 GenAD(Generative Autonomous Driving) 프레임워크를 소개하고자 합니다.
  • GenAD는 자율주행을 미래 경로(trajectory)를 생성하는 문제로 바라봄

GenAD의 혁신적인 접근

1. 인스턴스 중심의 장면 표현

  • GenAD는 주변 환경을 보다 효율적으로 표현하기 위해 인스턴스 중심의 장면 표현(instance-centric scene representation)을 도입했습니다.

  • 이는 각 객체(인스턴스)별로 주변 정보를 통합하여 표현하는 방식입니다.

  • 맵 정보 통합: 객체의 위치와 도로 정보(차선, 신호등 등)를 함께 고려하여, 객체가 도로 상에서 어떤 위치에 있는지 정확히 파악합니다.

  • 고차 상호작용 고려: 자율주행 차량과 주변 객체들 간의 복잡한 상호작용을 반영합니다.

2. 미래 경로의 구조적인 특징 학습

  • GenAD는 미래의 경로가 가지는 구조적인 특성을 모델에 반영하기 위해 변분 오토인코더(Variational Autoencoder, VAE)라는 기법을 사용합니다.
  • 불확실성 반영:
    • 미래의 움직임은 여러 가능성을 가질 수 있으므로, 확률적인 방법을 통해 다양한 경로를 예측
  • 구조적인 패턴 학습:
    • 대부분의 차량 경로는 일정한 패턴(예: 직선 주행, 서서히 회전 등)을 따르므로, 이러한 패턴을 학습하여 더욱 현실적인 경로를 생성

3. 시간적인 움직임 모델링

미래의 움직임을 보다 정확히 예측하기 위해, GenAD는 게이트 순환 유닛(Gated Recurrent Unit, GRU)을 사용하여 시간적인 변화를 모델링

  • 자동 회귀 모델링:
    • 이전 시간의 정보를 기반으로 다음 시간을 예측하는 방식으로, 객체들의 움직임을 시간에 따라 연속적으로 예측
  • 효율적인 계산:
    • GRU는 복잡한 계산 없이도 시간적인 정보를 효과적으로 처리할 수 있어 모델의 효율성을 높임

GenAD의 동작 과정

  1. 장면 토큰화(Scene Tokenization): 주변 카메라로부터 얻은 이미지에서 각 객체와 맵 정보를 추출하여 인스턴스 중심의 표현으로 변환

  2. 잠재 공간 학습(Latent Space Learning):

  • 변분 오토인코더를 사용하여 실제 경로 데이터를 잠재 공간에 매핑하고,
  • 미래 경로의 구조적인 특성을 학습
  1. 미래 경로 생성(Future Trajectory Generation):
  • 학습된 잠재 공간에서 샘플링하여 다양한 가능성의 미래 경로를 생성
  1. 동시 예측 및 계획(Motion Prediction and Planning):
  • 생성된 경로를 바탕으로 주변 객체들의 움직임을 예측하고, 자율주행 차량의 최적의 주행 경로를 계획

결론 및 향후 과제

GenAD는 자율주행을 위한 새로운 세대의 접근 방식으로, 미래 경로를 생성하는 문제로 재해석함으로써 기존의 한계를 극복했습니다.

  • 고차 상호작용의 고려: 자율주행 차량과 주변 객체들 간의 복잡한 미래 상호작용을 효과적으로 모델링할 수 있습니다.
  • 구조적인 경로 특성의 활용: 미래 경로의 패턴과 구조를 학습하여 더욱 현실적인 예측이 가능합니다.

향후 연구 방향

  • 다른 생성 모델의 적용: 생성적 적대 신경망(GAN)이나 확산 모델(Diffusion Model)과 같은 다른 생성 모델을 적용하여 성능을 더욱 향상시킬 수 있을 것
  • 실시간 적용 가능성 탐색: 실제 주행 환경에서의 실시간 적용 가능성을 검토하고자 함

profile
새로운 것이 들어오면 이미 있는 것과 충돌을 시도하라.

0개의 댓글