이전에 배웠던 ResNet, DensNet, GoogleNet 등 이러한 네트워크가 이미지 분류만에만 사용되지 않고, Semantic Segmentation 과 Object Detection 에도 사용되었다.
Semantic Segmentation
이미지 안의 모든 객체를 탐지해 분류하는 것으로, 이미지의 모든 픽셀이 어떤 label에 들어가는지 보고 싶을 때 사용한다.
ex) 자율 주행 자동차에 비유하면 차선을 따라서 가야하고 차 혹은 사람이 앞에 있으면 멈춰야 하는 경우에 사용
지금까지의 CNN은 Convolution, pooling 등을 하고 flatten으로 펼쳐서 fc layer를 통해 output을 추출하는 구조였다
앞으로 배우는 Fully Convolution Network는 Dense 층을 제거하고, convolution layer로 대체한다.
기본적인 CNN 구조
Fully Convolutional Network
위의 사진과 같이 Dense layer를 convolution layer로 대체하여도 사용되는 파라미터의 수는 같으며 이러한 구조를 convolutionalization이라 한다.
Fully Convolutional Network
이렇게 10x10 special dimension을 100x100 이미지로 늘리는 방법이 필요해 졌고, Deconvolution 이라는 방법이 나타났다.
Deconvolution
Detection
이미지 안에서 어느 물체가 어디에 있는지 bounding box를 찾는 것
R-CNN 계열
- R-CNN : https://velog.io/@ysw2946/R-CNN
- Fast R-CNN : https://velog.io/@ysw2946/Fast-R-CNN
- Faster R-CNN : https://velog.io/@ysw2946/Faster-R-CNN
YOLO