github에서 다른 사람이 진행했던 결과를 보면 성능이 90% 이상 나오지 않았던게 기억이 났다. test data에 normal events가 너무 많지 않았나 싶다.
📝 두번째 시도
Dataset
Normal 300개 (train 250, test 50)
Abnormal 300개 (train 264, test 36)
Assault 50개 (train 47, test 3)
Fighting 50개 (train 45, test 5)
Robbery 150개 (train 145, test 5)
Shooting 50개 (train 27, test 23)
추출되어 있는 I3D feature data(npy) 사용 - train, test data
we oversample each video frame with the “10-crop” augment
“10-crop” means cropping images into the center, four corners, and their mirrored counterparts.