CS231n | Lecture 5

yeonk·2021년 10월 18일

ai

목록 보기

9/9

Lecture 5 | Convolutional neural networks

앞부분은 CNN에 대한 히스토리를 설명해서 따로 필기하진 않았다.

이전에는 input image를 늘려서 wx에 넣었으나, 이 방법에는 문제(예. 말 머리 2개가 나오는 현상)가 있어서 방법을 변경하였다.

N: input size (N x N)
F: filter size (F x F)
stride: 옆으로 이동하는 값
+1: bias

output size가 정수로 떨어지지 않으면 안된다.

같은 부분이어도 필터가 다르면 다른 특징을 뽑아낸다.

전체 사이드에 0값을 둘러주는 것.
padding을 통해 이미지가 급격하게 줄어드는 것을 방지할 수 있음

이미지는 stride를 거칠수록 사이즈가 작아짐
이미지의 크기가 급격히 작아지면 낮은 층에서도 이미지가 소멸될 수 있음
이미지의 사이드 부분은 안쪽 부분에 비해 필터가 적용되는 횟수가 적음
필터 사이즈에 따른 일반적인 zero pad 적용
- filter 3 → zero pad 1겹
- filter 5 → zero pad 2겹
- filter 7 → zero pad 3겹