부스트코스 강의 딥러닝 기초 다지기 중 'CNN - Convolution은 무엇인가?'를 정리한 내용이다.
출력이미지의 채널값과 사이즈는 입력이미지와 필터의 채널값과 사이즈를 통해 구할 수 있다. 사이즈는 "입력이미지 사이즈 - 필터 사이즈 + 1" 이고 채널값은 필터의 채널값(개수)으로 변한다.
CNN은 Convolution layer, pooling layer, fully connected layer로 구성되어 있다.
Stride: Convolution filter를 얼마나 자주 찍을지를 나타낸다.
Padding: Convolution operations을 하면 Output의 크기가 줄어드므로 값을 덧대어준다. 가장자리의 특징도 구할 수 있게 해준다.
parameter의 개수 구하기
Dense layer가 훨씬 더 많은 parameter를 갖게 된다.
모델의 발전하기 위해 parameter를 줄이는게 중요한데, 그러기 위해선 뒷단의 fully connected layer를 최대한 줄이고, 앞단의 convolution layer들을 깊게 쌓는게 유리하다.
1x1 Convolution