야구 피치 동작
에서는 크게 걸음을 걸을 때 포착하는 데 실패하였고, 테니스 서브 동작
에서는 팔의 위치를 바꾸는 등 문제가 있었음.기존 HMR 방법들은 역동적인 동작을 포함하는 비디오에서 성능이 저하되는 경향이 있었음.
이러한 문제점을 해결하기 위해서, 같은 동작의 다수의 비디오 인스턴스에서 공유되는 정보를 활용하여 global 3D 동작을 학습하는 Neural Motion (NEMO)를 제안함.
TTO algorithm
먼저, 모델은 입력 이미지에서 인체의 3D 자세와 모양에 대한 초기 예측을 수행함
최적화 진행 -> 2D key point와 3D model 간의 불일치를 최소화하는 방향으로 진행
SMPLify
ReLU 함수는 시그모이드 함수들이 증가하도록 보장함.
T
: 주어진 동작 시퀀스의 총 길이
φ
: output
σ
: 로지스틱 함수ReLU
: ReLU 활성화 함수1번째 단계
2번째 단계
Geman-McClure error function
을 사용하는 데 , 이는 평균 제곱 오차보다 이상치에 대해 더 강건함.NeMo
라는 신경 운동 표현 및 최적화 프레임워크를 제안함.
- 저자가 뭘 해내고 싶어 했는가?
- 이 연구의 접근 방식에서 중요한 요소는 무엇인가?
- 참고하고 싶은 다른 레퍼런스에는 어떤 것이 있는가?
- 느낀점은?
논문