๐ ๋ณธ ๋ด์ฉ์ Michigan University์ 'Deep Learning for Computer Vision' ๊ฐ์๋ฅผ ๋ฃ๊ณ ๊ฐ์ธ์ ์ผ๋ก ํ๊ธฐํ ๋ด์ฉ์ ๋๋ค. ๋ด์ฉ์ ์ค๋ฅ๋ ํผ๋๋ฐฑ์ด ์์ผ๋ฉด ๋ง์ํด์ฃผ์๋ฉด ๊ฐ์ฌํ ๋ฐ์ํ๊ฒ ์ต๋๋ค.
(Stanford์ cs231n๊ณผ ๋ด์ฉ์ด ๊ฑฐ์ ์ ์ฌํ๋ ์ฐธ๊ณ ํ์๋ฉด ๋์ ๋์ค ๊ฒ ๊ฐ์ต๋๋ค)๐
1) ๋ฌธ์ ์
linear classifier๋ก ๋ถ๋ฅ ์๋ ๋ ๋๋ฌด ๋ง์
๊ธฐํํ์ ๊ด์ & ์๊ฐ์ ๊ด์
2) ํด๊ฒฐ์ฑ
Feature Transform
ํน์ง
๋ถ๋ฅ์ ๋ ์ ํฉํ๋๋ก ์ ๋ ฅ๋ฐ์ดํฐ์ ์ ์ฉ (์ ๊ณฑ, tanํจ์์ฌ์ฉ)
๋ค์ original space๋ก ๋ณ๊ฒฝ
๊ฒฐ๋ก
1) Color Histogram
2) Histogram of Oriented Gradients (HoG)
์์ฝ: input image์ ๋ชจ๋ ์์น์์ local ๋ฐฉํฅ & ๊ฐ๋๋ก ํํ
color information ๋ฒ๋ฆผ (local edge & strength์๋ง ๊ด์ฌ)
=โ 1,2 ์ ์์ฐ์: ์ด 2๊ฐ์ง๋ ์ฌ๋์ด input data์ ์ฌ๋ฐ๋ฅธ quality๊ฐ ๋ญ์ ์๊ฐํด์ผ๋ผ์
3) Bag of Words
๊ฐ๋
ํน์ง
4) ์ฌ๋ฌ๊ฐ์ feature representation ์ฌ์ฉ (๋ชจ๋ ์กฐํฉ)
1) ์ ์ฒด ํ๋ฆ
raw image pixel
โ Feature Extraction โ(f: ๋ถ๋ฅ ์ฑ๋ฅ ์ต๋ํ ์ํด ์ค์ค๋ก ์กฐ์ X)โ 10 numbers giving scores for classes โ (training(ํ์ต๊ฐ๋ฅ๋ชจ๋ธ)) โ ๋ค์ ๋ฐ๋ณต
=โ ๊ฒฐ๋ก ) ๋ ๋์ ๋ฐฉ๋ฒ ์ฌ์ฉ ํ์
(์ด๋ฏธ์ง ๋ถ๋ฅ์, system์ ๋ชจ๋ ๋ถ๋ถ์ ์๋์ ์กฐ์ ํ์ฌ ์ฑ๋ฅ ๋์)
(Neural Network๊ฐ ํ๋์ผ์ ๋ํ ๋๊ธฐ)
2) Image Features vs Neural Networks
๐NN์ด ๊ฐ์ฅ ๊ฐ๋ ฅํ 1๋ฒ์งธ ์ด์ - W์ ์ญํ
1) ๊ฐ๋
2) W์ ์ญํ
NN์ด ๊ฐ์ฅ ๊ฐ๋ ฅํ 1๋ฒ์งธ ์ด์
a. W์ ์ด์ ๋ ์ด์ด์ ๋ํ ์ํฅ๋ ฅ ์ ๋ฌ ์ญํ
์ด์ ๋ ์ด์ด์ ๊ฐ ์์๊ฐ ๋ค์ ๋ ์ด์ด์ ๊ฐ ์์์ ์ผ๋ง๋ ์ํฅ๋ฏธ์น๋์ง ์๋ ค์ค
๋ง๊ทธ๋๋ก ๊ฐ์ค์น์ธ๋ฏ. ์ด์ ๋ ์ด์ด์ ๋ํ ๊ฐ์ค์น
ex. W1 = input layer x๊ฐ hidden layer h์ ๊ฐ ์์์ ์ผ๋งํผ ์ํฅ ๋ฏธ์น๋์ง
W2 = hidden layer์ ๊ฐ ์์๊ฐ ์ถ๋ ฅ score์ ๊ฐ ์์์ ์ผ๋งํผ ์ํฅ ๋ฏธ์น๋์ง
Fully connected Neural Network
b. W์ template ์ญํ
๊ฐ๋
Neural net: 1๋ฒ์งธ layer = template ๋ชจ์
2๋ฒ์งธ layer = template ์ฌ์กฐํฉ
์จ๊ฒจ์ง ๊ณ์ธต์ ๊ฐ ํด์ ๋ฐฉ๋ฒ
: ํ์ต๋ ๊ฐ template์ด ์
๋ ฅ์ด๋ฏธ์ง x์ ์ผ๋งํผ ๋ฐ์ํ๋์ง
โ ๋ด๋ถ์ ๋ํด ์๋ฒฝํ ํด์X,
but 2-layer Neural Network System์์ ํ์คํ ์๋ณํ ์ ์๋ ๊ณต๊ฐ๊ตฌ์กฐ
class์ ์ฌ๋ฌ mode๋ณ ๋ค๋ฅธ template์ฌ์ฉ ๊ฐ๋ฅ
: ์ ํ๋ถ๋ฅ์์ ๋ง์ ๋จธ๋ฆฌ๊ฐ 2๊ฐ ๋๋ ๋ฌธ์ ํด๊ฒฐ
๋ถ์ฐ ํํ (๊ณต๊ฐ๊ตฌ์กฐ ํ์ ๊ฐ๋ฅ + ์ ํ์กฐํฉ์ผ๋ก ์ด๋ฏธ์ง ์ ๋ณด ๋์ถฉ ํ์ ๊ฐ๋ฅ)
: W1์์ ํ์ตํ๋ ๊ฒ๋ค์ ๊ฑฐ์ ์ธ๊ฐ์ด ํด์ํ๊ธฐ ์ด๋ ค์
: ๋์ ์ด๋ค ์ข
๋ฅ์ ๊ณต๊ฐ๊ตฌ์กฐ ๊ฐ์ง๊ณ ์์ผ๋ฉฐ, ์ ๊ฒฝ๋ง์ ๋ถ์ฐํํ์ด๋ผ๋ ๊ฐ๋
์ฌ์ฉํด ์ด๋ฏธ์ง ๋ํ๋
& ์ ํ์กฐํฉ ํตํด ์ด๋ฏธ์ง ์ ๋ณด ์์O
1) ๊ฐ๋
2) Question
Q. ํ์ฑํํจ์๊ฐ ์์ผ๋ฉด ์ด์ผ๋ ๊น?
โ A. ์ฌ์ ํ ์ ํ๋ถ๋ฅ ํ๊ฒ ๋๋ค.
ex. deep linear network (์ต์ ํ์์ ์ฃผ๋ก ์ฐ์)
3) ์ข ๋ฅ
๐NN์ด ๊ฐ์ฅ ๊ฐ๋ ฅํ 2๋ฒ์งธ ์ด์ - ํ์ฑํํจ์๋ก ๋น์ ํ ๋ถ๋ฅ ๊ฐ๋ฅ
1) ๊ฐ๋
ํ์ฑํ ํจ์ ์ ์ฉ (๋น์ ํ)
์ค์ ์ ์ฉ ์์
์ ์ฉ ํ ๊ฒฐ๊ณผ
๋ค์ original space๋ก ๋๋ฆด๋
original space์์ ๋น์ ํ boundary ์ค์ ์์(=๋ค์ ๋๋ฆด๋ ๋น์ ํ ๋ถ๋ฆฌ ๋จ)
=โ ๊ฒฐ๋ก 1) ์ฌ๋ฌ ์ ํ๋ถ๋ฅ๊ธฐ์ ๊ฐ์ ์ข ๋ฅ๋ก ํด์ํ ๋, ๋ชจ๋ ์ข ๋ฅ์ ๊ณต๊ฐ์ ์์ฒด์ ์ผ๋ก ์ ์์์์
โ ๊ทธ๋ฆฌ๊ณ ์ ํ ๊ณต๊ฐ์์ ์ ํ๋ถ๋ฅ ํจ
โ ๊ณผ์ ํฉ ๋ฐ์ ๊ฐ๋ฅ
=โ ๊ฒฐ๋ก 2) Neural Network์ ๋ง์ง๋ง์ linearํ๊ฒ ๊ทธ๋ ค์ง
โ Neural Network์ญํ = linearํ๊ฒ ๊ธ๊ธฐ ์ ๊น์ง
โ feature๋ณํ ์ฌ๋ฌ๊ฐ ์๋ ํ ๋ง์ง๋ง ์ ๊ทธ์์๋ ์ ๋ถ๋ฅ
1) ๊ฐ๋