WSVAD: 약한 지도학습 비디오 이상탐지는 비디오 level 레이블만 존재하는 상황에서 각 스니펫의 이상 여부를 탐지할 수 있는 디텍터를 학습하는 것이 목표임.
WSVAD의 목표
1. 비디오 레벨 clasification
2. 스니펫 레벨 clasification
즉, 연기, 큰 움직임은 정상일 수 있지만 모델은 비정상으로 잘못 예측할 수 있고, Vise versa로 실제로는 비정상이지만 모델은 정상으로 잘못 예측할 수 있음.
UMIL은 WSVAD에서 편향되지 않은 이상 탐지기를 학습하는 새로운 방법
UMIL은 다양한 컨텍스트 편향을 가진 확신 스니펫과 애매한 스니펫 사이의 불변성을 추구하여 편향되지 않은 이상 탐지기를 학습합니다.
UMIL은 특성 미세 조정과 탐지기 학습을 결합한 최초의 WSVAD 방법입니다
UMIL의 편향 없는 목표 덕분에, 특성 미세 조정(feature fine-tuning)과 탐지기 학습(detector learning)을 결합한 종단 간(end-to-end) 훈련 방식이 가능해졌습니다.
이를 통해 비디오 이상 탐지(VAD)에 더 적합한 특성 표현을 학습할 수 있습니다.
UMIL은 미세한 비디오 분할 전략을 채택하여 비디오 스니펫의 미세한 이상 정보도 보존합니다
비디오 스니펫을 세밀하게 분할하여 미세한 이상 정보를 보존합니다.
UMIL은 UCF-Crime 및 TAD 벤치마크에서 현재 최신 방법들보다 개선된 성능을 제공합니다
UMIL은 UCF-Crime 벤치마크에서 1.4% AUC, TAD 벤치마크에서 3.3% AUC의 성능 향상을 달성했습니다.
UMIL은 MIL 기본 모델과 비교하여 두 데이터셋 모두에서 2% 이상의 AUC 성능 향상을 제공하여 UMIL의 효과를 입증합니다