⌜An Image Worth 16 x 16 Words : Transformers for Image Recognition At Scale⌟는 ViT(Vision Transformers)에 관한 논문이다.