[부스트캠프 AI Tech 5기] Computer Vision Applications

컴퓨터비전 Task 정리
Semantic Segmantation
FCN

- Fully Convolutional Network
- Dense Layer를 제거하는 효과
- Flatten 하고 Dense를 하는 것과 FCN은 동일한 파라미터 숫자
- Convolution 은 shared parameter이기에, Heatmap과 같은 효과처럼 작동
Deconvolution
- stride로 줄인 dimension을 다시 키워주는 연산
- 엄밀히 역 연산으로 복원하는 것은 불가
- Parameter의 숫자와 Input Output 관점에서는 동일
Detection
- 이미지 내부의 Bounding box를 찾는 것
R-CNN

- 이미지 내부에 무작위 Bounding Box를 찾아 다 CNN, SVM을 돌림
SPPNet
- 모두 CNN을 돌리는게 아닌, CNN을 돌린 결과의 Tensor 만 뽑아옴
- R-CNN 보다 훨씬 빠름
Faster R-CNN
- SPPNet과 거의 동일한 결과에 roi-feature 도입
- bounding box를 뽑는 것도 network로 학습하자는 것
- 이를 RPN(Region Proposal Network) 라고 함
Anchor box
- 미리 만들어놓은 Template (bounding box의 크기 및 모양)
FCN
- FCN이 일종의 Bounding Box의 역할을 하는 것
YOLO
- Extremely fast object detection algorithm
- 그냥 이미지 한장에서 바로 BB를 추출해버림
- You Only Look Once
- region proposal하는 과정이 없음