post-thumbnail

[DeiT 관련 논문 리뷰] 04-Training data-efficient image transformers & distillation through attention(DeiT)

이번 글에서는 Training data-efficient image transformers & distillation through attention(2021)을 리뷰하겠습니다. DeiT 관련 논문 리뷰의 마지막 글이며, DeiT를 소개합니다.DeiT의 특징은 크게 두

2023년 5월 2일
·
3개의 댓글
·
post-thumbnail

[DeiT 관련 논문 리뷰] 03-AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE

이번 글에서는 AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE(2021)을 리뷰하겠습니다. 본 논문에서는 Vision Transformer 모델을 소개합니다.

2023년 4월 13일
·
4개의 댓글
·
post-thumbnail

[DeiT 관련 논문 리뷰] 02-Distilling the Knowledge in a Neural Network

이번 글에서는 Distilling the Knowledge in a Neural Network(2015)을 리뷰하겠습니다. 본 논문에서는 teacher 모델의 지식을 student 모델에게 전달하는 방법을 제시합니다. 이 방법을 통해 학습한 student 모델이 te

2023년 4월 11일
·
3개의 댓글
·
post-thumbnail

[DeiT 관련 논문 리뷰] 01-개요

DeiT 모델을 이해하기 위해 세 개의 논문을 순차적으로 리뷰하도록 하겠습니다. Distilling the Knowledge in a Neural Network(2015) 이 논문에서 DeiT의 훈련 전략의 기초가 되는 distillation에 대해 이해하겠습니다.

2023년 4월 7일
·
7개의 댓글
·