๐ŸŸฉ33๊ฐœ ์‹ค์ „ํ‚คํŠธ ์™„์„ฑ Part1. (1)

Da Woon Kimยท2023๋…„ 11์›” 27์ผ
0

CV kit leasure

๋ชฉ๋ก ๋ณด๊ธฐ
2/2

Faster R-CNN

Object detection์˜ ๊ฐ€์žฅ ๊ธฐ๋ณธ์ ์ธ ๋ฐฉ๋ฒ•์œผ๋กœ ์†Œ๊ฐœ ๋˜๊ณ  ์žˆ๋Š” R-CNN์ด๋‹ค. R-CNN์ด๋ž€ Region์„ ๊ฒ€์ถœํ•ด CNN์œผ๋กœ ์–ด๋–ค ๋ฒ”์œ„์— ๊ฐ์ฒด๊ฐ€ ์žˆ๋Š”์ง€, ์–ด๋–ค ๋ฒ”์ฃผ์— ์†ํ•˜๋Š”์ง€๋ฅผ ๊ตฌ๋ถ„ํ•˜๋Š” ๋ชจ๋ธ์ด๋‹ค. ๊ฐ€์žฅ ๊ธฐ์ดˆ๊ฐ€ ๋˜๋Š” ๋ชจ๋ธ๋กœ ์ด๋ฒˆ์—๋Š” ์ด ๋ชจ๋ธ์— ๋Œ€ํ•ด์„œ ํŒŒํ—ค์ณ๋ณด๋ ค ํ•œ๋‹ค. ์—ฌ๊ธฐ์—์„œ ROI๋Š” Region of Interest์ด๋‹ค.

R-CNN

๋‹ค์Œ์€ R-CNN์˜ ๋„คํŠธ์›Œํฌ ๊ตฌ์กฐ๋‹ค.

์ด ๋ชจ๋ธ์€ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ž‘๋™ํ•œ๋‹ค.

  1. Image๋ฅผ ์ž…๋ ฅ๋ฐ›๋Š”๋‹ค.
  2. Selective search ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ์˜ํ•ด regional proposal output ์•ฝ 2000๊ฐœ๋ฅผ ์ถ”์ถœํ•œ๋‹ค.
  3. ์ถ”์ถœํ•œ regional proposal output์„ ๋ชจ๋‘ ๋™์ผ input size๋กœ ๋งŒ๋“ค์–ด์ฃผ๊ธฐ ์œ„ํ•ด warpํ•ด์ค€๋‹ค.
  4. 2000๊ฐœ์˜ warped image๋ฅผ ๊ฐ๊ฐ CNN ๋ชจ๋ธ์— ๋„ฃ๋Š”๋‹ค.
  5. ๊ฐ๊ฐ์˜ Convolution ๊ฒฐ๊ณผ์— ๋Œ€ํ•ด classification์„ ์ง„ํ–‰ํ•˜์—ฌ ๊ฒฐ๊ณผ๋ฅผ ์–ป๋Š”๋‹ค.

์—ฌ๊ธฐ์„œ ๊ตณ์ด ์‚ฌ์ด์ฆˆ๋ฅผ ํ†ต์ผํ•ด์•ผ ํ•˜๋Š” ์ด์œ ๋ฅผ ๋ฌป๋Š” ์‚ฌ๋žŒ๋“ค์ด ์žˆ์„๊ฒƒ์ด๋‹ค. CNN์˜ ํŠน์„ฑ์— ์˜ํ•ด input size๊ฐ€ 227 x 227 size๋กœ ๊ณ ์ •์ด ๋˜์–ด ์žˆ๋‹ค๊ณ  ํ•œ๋‹ค. ๋”ฐ๋ผ์„œ bounding box๊ฐ€ ์ œ๊ฐ๊ฐ์ธ ROI๋ฅผ R-CNN์„ ํ™œ์šฉํ•˜์—ฌ ๋ถ„๋ฆฌํ•˜๊ธฐ ์œ„ํ•ด์„œ ์‚ฌ์ด์ฆˆ๋ฅผ ๋จผ์ € ์กฐ์ ˆํ•˜๊ณ  ์ง„ํ–‰ํ•œ๋‹ค.

Selective Search Algorithm

์ด ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ๋‹ค์–‘ํ•œ ROI๊ฐ€ ์กด์žฌํ•˜๊ฒŒ ๋˜๋Š”๋ฐ ๊ทธ๋ฆฌ๋‹ค ๋ณด๋ฉด ๊ฐ์ฒด๊ฐ€ ๊ฒน์ณ์ง€๊ธฐ๋„ ํ•˜๊ณ  ์ข‹์ง€ ์•Š์€ ROI๊ฐ€ ์ƒ๊ธฐ๊ธฐ๋„ ํ•œ๋‹ค. ์ด๋Ÿฌํ•œ ROI๋“ค ์ค‘์— ๊ฐ€์žฅ ์˜๋ฏธ๊ฐ€ ๊นŠ์€ bounding box๋ฅผ ๋งŒ๋“ค๊ธฐ ์œ„ํ•ด ์ง„ํ–‰ํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๋‹ค. ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์ง„ํ–‰ ์ˆœ์„œ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

  1. ์‚ฌ์šฉํ•˜๋Š” ์ด๋ฏธ์ง€๋ฅผ pixel ๋‹จ์œ„๋กœ segmentation์„ ์ง„ํ–‰ํ•œ๋‹ค.

  1. ์œ ์‚ฌํ•œ ์ข…๋ฅ˜์˜ segment๋ฅผ ๊ฒฐํ•ฉํ•œ๋‹ค. ์ด๋กœ์จ ๋” ํฐ region์„ ๋งŒ๋“ ๋‹ค.

  1. ์ตœ์ข…์ ์œผ๋กœ ๋‚จ์€ segment๋ฅผ ๊ตฌ๋ถ„์ž๋กœ ์„ค์ •ํ•œ๋‹ค.

์—ฌ๊ธฐ์—์„  ํ”ํžˆ ๊ทธ๋ฆฌ๋”” ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์‚ฌ์šฉํ•œ๋‹ค๊ณ  ํ•œ๋‹ค. ์œ ์‚ฌํ•œ segment๋ฅผ ๊ฒฐํ•ฉํ•˜๋‹ค๋ณด๋ฉด ์–ธ์ œ๊นŒ์ง€ ๊ฒฐํ•ฉํ•ด์•ผํ•˜๋Š”์ง€ ๊ถ๊ธˆ์ฆ์ด ์ƒ๊ธธ ์ˆ˜ ์žˆ๋‹ค. ๊ธฐ์ค€์ ์œผ๋กœ๋Š” ์œ ์‚ฌํ•œ region์ด ํ•˜๋‚˜๋งŒ ๋‚จ์„๋•Œ ๊นŒ์ง€ ๋ฐ˜๋ณตํ•œ๋‹ค๊ณ  ํ•œ๋‹ค. ๋‘ ์˜์—ญ์˜ ์ฐจ์ด๋ฅผ ๊ธฐ์ค€์ง“๋Š” threshold๋ฅผ ํ†ตํ•ด ๊ฒฐํ•ฉํ• ์ง€๋ฅผ ๊ฒฐ์ •ํ•œ๋‹ค.

SVM

feature map์„ classifier์— ์ ์šฉํ•  ๋•Œ CNN์„ ํ™œ์šฉํ•˜์ง€ ์•Š๊ณ  SVM์„ ์‚ฌ์šฉํ•˜๋Š” ์ด์œ ์— ๋Œ€ํ•ด ํ•œ๋ฒˆ ์ƒ๊ฐํ•ด ๋ณผ ํ•„์š”๊ฐ€ ์žˆ๋‹ค. ์ด์œ ๋Š” ๋ฐ”๋กœ ์„ฑ๋Šฅ ๋•Œ๋ฌธ์ธ๋ฐ SVM์„ ํ™œ์šฉํ–ˆ์„ ๋•Œ CNN๋ณด๋‹ค ์„ฑ๋Šฅ์ด ๋” ์ข‹์•˜๋‹ค๋Š” ๊ฒฐ๊ณผ๊ฐ€ ์žˆ๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค.

Fast R-CNN

๊ทธ๋Ÿฌ๋‚˜ R-CNN์€ ์—ฌ๋Ÿฌ๊ฐ€์ง€ ๋‹จ์ ์ด ์žˆ๋‹ค๊ณ  ํ•œ๋‹ค. ๋Œ€ํ‘œ์ ์œผ๋กœ ๋ชจ๋ธ์„ ํ™œ์šฉํ•  ๋•Œ ๊ฐ ConvNet๋ณ„๋กœ ๋ณ„๋„ ์‹œํ–‰์„ ํ•ด์•ผํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์‹œ๊ฐ„์ด ์˜ค๋ž˜๊ฑธ๋ฆฐ๋‹ค๋Š” ๋‹จ์ ์ด ์žˆ๊ณ , input size๊ฐ€ ๊ณ ์ •๋˜์–ด์žˆ๊ธฐ ๋•Œ๋ฌธ์— ์ •๋ณด์˜ ์†์‹ค ๋˜ํ•œ ์กด์žฌํ•œ๋‹ค๋Š” ๋‹จ์  ๋•Œ๋ฌธ์— ์ด๋ฅผ ๋ณด์™„ํ•˜๊ธฐ ์œ„ํ•ด ๋‚˜์˜จ ๋ชจ๋ธ์ด๋‹ค. ์ด ๋ชจ๋ธ์€ ๋‹ค์Œ๊ณ  ๊ฐ™์€ ์žฅ์ ์ด ์žˆ๋‹ค.

  1. inference๋ฅผ ํ–ฅ์ƒ
    • ํ•„ํ„ฐ๋ฅผ 1ํšŒ ํ†ต๊ณผ์‹œํ‚ค๊ณ  ๊ทธ ํ•„ํ„ฐ๋ฅผ ์žฌ์‚ฌ์šฉํ•ด computation cost๋ฅผ ์ค„์ธ๋‹ค.
  1. end to end
    • SVM์„ ๊ณผ์ •์„ ์—†์• ๊ณ  Gradient๋ฅผ ๋„์ž…์‹œ์ผฐ๋‹ค.
  1. ๋ฉ€ํ‹ฐํƒœ์Šคํฌ ๋Ÿฌ๋‹
    • BBoxRegressor์„ ์ ์šฉํ•ด ๋ฐ•์Šค๋ฅผ ์ ์šฉ์‹œํ‚ค๊ณ  ROI pooling ๋ฐฉ๋ฒ•์ด ์ถ”๊ฐ€์ ์œผ๋กœ ๋“ค์–ด๊ฐ„๋‹ค.

๊ตฌ์กฐ ๋ฐ ํŠน์ง•

Fast R-CNN์€ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๊ตฌ์กฐ๋ฅผ ์ง€๋…”๋‹ค.

Conv feature map์—์„œ ํ•„ํ„ฐ๋ฅผ ํ•œ๋ฒˆ ํ†ต๊ณผํ•ด feature matrix๋ฅผ ์ƒ์„ฑํ•œ ๋’ค ROI feature vector์„ ํ†ตํ•ด ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ bbox์™€ class๋ฅผ ํŒ๋ณ„ํ•ด ๋‚ด๋Š” ๋ชจ๋ธ์ด๋‹ค.

์‚ฌ์šฉ๋˜๋Š” ๊ณผ์ •์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

  1. selective search๋ฅผ ์ด์šฉํ•ด ROI๋ฅผ ์ถ”์ถœํ•ด๋‚ธ๋‹ค.
  2. ํ’€๋ง์„ ์œ„ํ•œ ์„ ํƒํ˜• windowํ™”๋ฅผ ์ง„ํ–‰ํ•œ๋‹ค.
  3. pooling ๊ธฐ๋ฒ•์„ ์ด์šฉํ•˜์—ฌ ๊ฐ ์œˆ๋„์šฐ ๋ณ„๋กœ ํ’€๋ง์„ ์ ์šฉํ•œ๋‹ค.

ROI Pooling

pooling์€ ๋‹ค์Œ๊ณผ ๊ฐ™์ด window๋ฅผ ๊ธฐ์กด์— ์„ค์ •ํ•œ ํฌ๊ธฐ์— ๋งž๊ฒŒ ์กฐ์ ˆํ•ด ์ฃผ๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉํ•œ๋‹ค. ์•„๋ž˜์˜ ์ด๋ฏธ์ง€ ๊ณผ์ •์ฒ˜๋Ÿผ Pooling์„ ์ง„ํ–‰ํ•œ๋‹ค.

๊ณผ์ •์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

  1. ๋ฏธ๋ฆฌ ์„ค์ •ํ•œ HxWํฌ๊ธฐ๋กœ ๋งŒ๋“ค์–ด์ฃผ๊ธฐ ์œ„ํ•ด์„œ (h/H) * (w/H) ํฌ๊ธฐ๋งŒํผ grid๋ฅผ RoI์œ„์— ๋งŒ๋“ ๋‹ค.
  2. RoI๋ฅผ gridํฌ๊ธฐ๋กœ split์‹œํ‚จ ๋’ค max pooling์„ ์ ์šฉ์‹œ์ผœ ๊ฒฐ๊ตญ ๊ฐ grid ์นธ๋งˆ๋‹ค ํ•˜๋‚˜์˜ ๊ฐ’์„ ์ถ”์ถœํ•œ๋‹ค.

์œ„ ์ž‘์—…์„ ํ†ตํ•ด feature map์— ํˆฌ์˜ํ–ˆ๋˜ hxwํฌ๊ธฐ์˜ RoI๋Š” HxWํฌ๊ธฐ์˜ ๊ณ ์ •๋œ feature vector๋กœ ๋ณ€ํ™˜๋œ๋‹ค.

Faster R-CNN

๊ทธ๋Ÿผ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ์—ฌ์ „ํžˆ ๋ณด์™„ํ•  ์ ์€ ์žˆ๋‹ค. Selective search ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๋˜ํ•œ ์ด๋ฏธ์ง€์—์„œ segmentation์„ ์„ ํƒํ•˜๋Š” ๊ณผ์ •์—์„œ ์‹œ๊ฐ„์ด ์˜ค๋ž˜๊ฑธ๋ฆฐ๋‹ค. ์ด ๋˜ํ•œ Conv Layer์—์„œ ์ง„ํ–‰ํ•˜๋ฉด์„œ ํ™œ์šฉ ์†๋„๋ฅผ ์ค„์ด๊ณ  ์„ฑ๋Šฅ์€ ๋” ๋†’์ผ ์ˆ˜ ์žˆ๋Š” Region Proposal์„ ํ™œ์šฉํ•œ๋‹ค.

๊ตฌ์กฐ ๋ฐ ํŠน์ง•

Faster R-CNN์˜ ๊ตฌ์กฐ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

Conv Layer๊ณผ RPN์„ ๊ณต์œ ํ•˜์—ฌ ์ œ์•ˆ๋œ ๋ชจ๋ธ์ด๋ผ๊ณ  ํ•œ๋‹ค. ์ด ๋ชจ๋ธ์˜ ํŠน์ง•์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

  • ๋ฐ•์Šค๋ฅผ ๋žœ๋คํ™”๋‚˜ ์˜ค๋ฒ„๋ ˆ์ด๋ฅผ ์ ์šฉํ•˜์ง€ ์•Š๊ณ  ์ „์ฒด ์ด๋ฏธ์ง€๋ฅผ ๊ฒฉ์ž ๋ฌด๋Šฌ๋กœ ์ชผ๊ฐ ๋‹ค.
  • ์•ต์ปค๋ฐ•์Šค(Anchor box)๋ฅผ ๋„์ž…ํ•˜์˜€๋‹ค.

์•ต์ปค๋ฐ•์Šค์— ๋Œ€ํ•œ ์ •์˜๋Š” MathWorks์—์„œ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค.

Multiple scale & size๋ฅผ ๋‹ค๋ฃจ๋Š” ๋ฐฉ๋ฒ•์€ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์„ธ๊ฐ€์ง€๊ฐ€ ์žˆ๋‹ค.

  1. ํ•˜๋‚˜์˜ scale&size classifier์„ ์‚ฌ์šฉํ•ด scale์„ ๋ฐ”๊พธ๋Š” ๋ฐฉ๋ฒ•
  2. ์˜์ƒ์˜ ํฌ๊ธฐ๋ฅผ ์ค„์ด๋Š” ๋Œ€์‹  filter size๋ฅผ ๋‹ค์–‘ํ™”
  3. Reference๋ฅผ ์—ฌ๋Ÿฌ๊ฐœ ์‚ฌ์šฉ

์—ฌ๊ธฐ์„œ ์•ต์ปค๋ฐ•์Šค๋Š” 3๋ฒˆ์— ๊ฐ€๊นŒ์šด ๋ฐฉ๋ฒ•์ด๋‹ค. ํ™•์‹คํ•˜์ง„ ์•Š์ง€๋งŒ ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด ๋ฐฉ๋ฒ•์ด๋‹ค.

RPN

RPN์€ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๊ตฌ์กฐ๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ๋‹ค.

k๊ฐœ์˜ ์•ต์ปค๋ฐ•์Šค๋ฅผ ํ™œ์šฉํ•ด ๊ฒฉ์ž๋ฌด๋Šฌ ์ด๋ฏธ์ง€์— ๋Œ€ํ•ด sliding window๋ฐฉ๋ฒ•์œผ๋กœ ์ด๋ฏธ์ง€ ํ‹€์„ ๋งŒ๋“ ๋‹ค์Œ ๊ฐ ์•ต์ปค๋ฐ•์Šค์™€ ๋Œ€์กฐํ•˜์—ฌ ํƒ์ง€ํ•ด๋‚ด๊ณ  ํด๋ž˜์Šค๋ฅผ ๋ถ„๋ฅ˜ํ•˜๋Š” ๋ฐฉ์‹์„ ํ™œ์šฉํ•œ๋‹ค. ์ตœ์ ์˜ ์•ต์ปค๋ฐ•์Šค๋ฅผ ์ฐพ์•„๋‚ด๊ธฐ ์œ„ํ•ด Non-Maximum Suppression(NMS)๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ•˜์—ฌ ๋‘๊ฐ€์ง€ ํ”ผ์ฒ˜๋ฅผ ์‚ฐ์ถœํ•ด๋‚ธ๋‹ค.

2k scores: ๋ฌผ์ฒด๊ฐ€ ์กด์žฌํ•˜๋Š”์ง€ ํ•˜์ง€์•Š๋Š”์ง€ ๊ตฌ๋ถ„ํ•˜๋Š” ๋ถ„๋ฅ˜๊ธฐ
4k coordinates: ์•ต์ปค๋ฐ•์Šค์˜ ์ค‘์‹ฌ์œ„์น˜, ๋†’์ด, ๋„“์ด

NMS

์ตœ์ ์˜ ์•ต์ปค๋ฐ•์Šค๋ฅผ ์ฐพ์•„๋‚ด๋Š” ๋ฐฉ๋ฒ•์œผ๋กœ ํ™œ์šฉ๋˜์—ˆ์œผ๋ฉฐ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ํŠน์ง•์„ ๊ฐ€์ง€๊ณ  ์žˆ๋‹ค.

  • ํ•œ ๋ฌผ์ฒด๋ฅผ ๊ฐ€๋ฆฌํ‚ค๋Š” ์—ฌ๋Ÿฌ๊ฐœ์˜ ๋ฐ•์Šค๋ฅผ ํ•˜๋‚˜๋กœ ์ถ”๋ฆฌ๋Š” ๊ณผ์ •
  • ์•ต์ปค๋ฐ•์Šค๋“ค ์ค‘์—์„œ ๊ฐ€์žฅ ํฐ ๋ฐ•์Šค ํ•˜๋‚˜๋ฅผ ์„ ํƒํ•ด ๊ฒน์ณ์žˆ๋Š” ์•ต์ปค๋ฐ•์Šค ๋ชจ๋‘๋ฅผ ํ†ตํ•ด confidence score๊ณผ IoU score์„ ์‚ฐ์ถœํ•œ๋‹ค.
  • Confidence score์€ ๊ฐ์ฒด๊ฐ€ ํฌํ•จ๋˜์–ด ์žˆ๋Š” ์ •๋„๋ฅผ ๋‚˜ํƒ€๋‚ด๊ณ  IoU score์€ ๋‹ค๋ฅธ ์•ต์ปค๋ฐ•์Šค์™€์˜ ๊ฒน์น˜๋Š” ๊ตฌ๊ฐ„์ด ๋งŽ์€๊ฐ€๋ฅผ ๊ณ„์‚ฐํ•œ๋‹ค.
  • Confidence score์ด ๋†’๊ณ  IoU score์ด ๋‚ฎ์„์ˆ˜๋ก ์•ต์ปค๋ฐ•์Šค๊ฐ€ ์„ ํƒ๋  ๊ฐ€๋Šฅ์„ฑ์ด ๋†’๋‹ค.

ํ•™์Šต ์ „๋žต

Loss๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์ด ๊ณ„์‚ฐํ•œ๋‹ค.

์ตœ์ข…์ ์œผ๋กœ classification๊ณผ detection์„ ๊ฐ™์ด ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๋‘ ๊ฒฝ์šฐ์˜ Loss๋ฅผ ํ•ฉ์นœ ๊ฐ’์„ ์ตœ์ข… Loss๋กœ ํ™œ์šฉํ•œ๋‹ค.

๋˜ํ•œ ํ›ˆ๋ จ ๋‹จ๊ณ„์—์„œ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๊ณผ์ •์„ ํ†ตํ•ด ํ•™์Šต์‹œํ‚จ๋‹ค.

  1. ์ด๋ฏธ train๋œ ImageNet์œผ๋กœ RPN์„ end-to-end trainํ•œ๋‹ค.
  2. RPN์„ ์ด์šฉํ•˜์—ฌ Faster R-CNN์„ ํ•™์Šต์‹œํ‚จ๋‹ค.
  3. feature extraction์„ ์ง„ํ–‰ํ•˜๊ธฐ ์œ„ํ•ด RPN, Faster R-CNN์˜ ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์ˆœ์„œ๋Œ€๋กœ ํ•™์Šต์‹œํ‚จ๋‹ค.

ํผํฌ๋จผ์Šค ์ธก์ • ๋ฐฉ๋ฒ•

์ด๋ฏธ์ง€ ํƒ์ง€์— ๊ฐ€์žฅ ๋งŽ์ด ์“ฐ์ด๋Š” ์ •๋ฐ€๋„์™€ ์žฌํ˜„์œจ์„ ํ™œ์šฉํ•œ Average Precision์„ ์—ฌ๊ธฐ์„œ ๋˜ํ•œ ํ™œ์šฉํ•œ๋‹ค. waytoliah์—์„œ ์ •๋ฆฌ๋ฅผ ๋งค์šฐ ์ž˜ํ•ด๋‘์—ˆ๋‹ค. ์ฐธ๊ณ ํ•ด์„œ ๋ณด๋ฉด ์ข‹์„๊ฒƒ ๊ฐ™์•„์„œ ๊ฐ€์ ธ์™”๋‹ค.

  • ZF: Conv Layer์„ ๋‹ค์„ฏ๊ฐœ๋งŒ ์‚ฌ์šฉํ•œ ๋ชจ๋ธ์„ ์นญํ•œ๋‹ค.

์ถœ์ฒ˜

R-CNN ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ
Selective Search Algorithm
Fast R-CNN ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ
Faster R-CNN ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ

profile
Data Science๋ฅผ ์ •๋ณตํ•˜๊ธฐ ์œ„ํ•ด ๊ธฐ๋ก์šฉ Velog

1๊ฐœ์˜ ๋Œ“๊ธ€

comment-user-thumbnail
2024๋…„ 11์›” 19์ผ

๋‹ค์šด๋‹˜ ํฌ์ŠคํŒ…๋ณด๊ณ  ๋”ฅ๋Ÿฌ๋‹์„ ๊ณต๋ถ€ํ•ด๋ณด๋ ค๊ณ ํ•ฉ๋‹ˆ๋‹ค

๋‹ต๊ธ€ ๋‹ฌ๊ธฐ