이번에 진행하는 이미지 분류 프로젝트를 위해 PoolFormer -s12 모델 기초 성능 테스트 진행해보았습니다.
PoolFormer모델은 SeaAILab에서 발표한 MetaFormer Is Actually What You Need for Vision(2022 CVPR ORAL)에서 제시된 모델입니다.

S12 모델을 선택하여 테스트 진행했습니다. 
MetaFormer 구조는 Token mixer 부분을 지정하지 않은 구조입니다.
빨간색 박스 영역이 각 모델의 Token Mixer입니다.
Token Mixer부분에 다양한 모듈을 지정할 수 있는데요, 무엇으로 지정하느냐에 따라 분류됩니다.

ref. https://sy00n.tistory.com/16

token mixer를 non-parametric operator인 Pooling으로 지정하였으나, 다른 MLP,Transfomer로 지정한 타 모델들과 견주었을 때 경쟁력있는 성능을 달성하였습니다.
