[딥러닝] SSD (single shot detection)

김영민·2022년 10월 6일

DL ML Object Detection SSD 객체인식 딥러닝 머신러닝

DeepLearning

목록 보기

25/33

모든 이미지의 출처는 인프런 : 컴퓨터 비전 완벽 가이드 에 있으며, 공부 기록용으로 블로그를 작성하는 것입니다.

SSD

수행 속도와 성능이 이전보다 훨씬 좋아진 모델입니다.

SSD의 주요 구성 요소 : Multi Scale Feature Layer + Anchor Box

Multi Scale Feature Layer

핵심

서로 다른 크기의 Feature Map들을 기반으로 Object Detection 수행하는 것.
Feature Map의 크기가 작을수록 더 큰 이미지를 찾을 수 있습니다.

anchor box를 활용하여 Object Detection

anchor box와 겹치는 feature map 영역의 object 클래스 분류
GT box 위치를 예측할 수 있도록 수정된 좌표

개별 anchor box가 갖고 있는 정보는
1. Detection하려는 object 유형의 softmax 값
2. 수정된 anchor box 좌표값

SSD Network

받는 원본 이미지 : 300X300 or 512X512
개별 셀의 anchor box 개수 : 4개
anchor box가 가지고 있는 정보 : Classes(객체 개수, pascal20이라고 하면 20 + 1(배경) ) + 4(좌표)
Feature map 별로 anchor box를 가지고 와서 Detections로 모아놓고, NMS를 통해 객체 인식 (아래 그림 참조)

이전 포스트

[딥러닝] R-CNN 계열 정리 (R-CNN, SPP Net, Fast R-CNN, Faster R-CNN)

다음 포스트

[딥러닝] GAN의 이해

0개의 댓글