2016๋ ์ ์ํ๊ณ ๋์ค๊ณ ์ธ๊ณต์ง๋ฅ ์ธ๊ธฐ๊ฐ ํญ๋ฐ์ ์ผ๋ก ์ฆ๊ฐํ๋ค.
์ธ๊ณต์ง๋ฅ => ์ฌ๋ฌ ๋ถ์ผ์ ํญ ๋๊ฒ ์ ์ฉ๋ ์ ์๋ค.
rule-based AI => ๊ท์น์ ์ ํฉํ๊ฒ ์ฒ๋ฆฌํ๋์ง๊ฐ ๊ฐ์ฅ ์ค์ํ๋ค.
๋จธ์ ๋ฌ๋ => ๋ชจ๋ธ์ ๋ง๋ค์ด ๋๊ณ ๋ฐ์ดํฐ์ ๊ท์น์ ์ฐพ๋ ๊ฒ์ด๋ค.
tensorflow ๋๋ keras
tensorflow ๋ ์ ์ฐ์ฑ์ด ๋๋ค. => ๋์ ํ๋ํ๋ ๋ง๋ค์ด์ผ ํ๋ค.
keras๋ ๋ธ๋ก์ ์๋ฏ์ด ์ฝ๋ฉํ๋ค๊ณ ํํ์ด ๋๋ค.
=> node1, node2์ ๋ฐํ๊ฐ์ ํ ์ํ์ด๋ค.
=> ๋ฐ๋ผ์ session์ ์ฌ์ฉํด์ ์ถ๋ ฅํด์ฃผ์ด์ผ ํ๋ค.
=> with์ ๊ฐ์ธ์ ๋ง๋ค์ด ์ค ์๋ ์๋ค.
=> placeholder: ๋ฐฐ์ด(ํ๋ ฌ)์ด๋ผ๊ณ ์๊ฐํ๋ฉด ๋๋ค.
=> feed_dict: ๊ฐ์ ๋ฃ์ด์ค๋ค.
model: H(x) = Wx + b (W, b์ ๊ฐ์ ์ฐพ์์ผ ํ๋ค.)
=> ์ค์ฐจ๋ค์ ํ๊ท ์ ๊ตฌํด์ Cost ํจ์๋ฅผ ๋์ถํ๋ค. =>๊ฐ์ฅ ์ ๋๋ก ํด์ผ ํ๋ค.
=> ์ ๊ณฑ์ด๊ธฐ ๋๋ฌธ์ 2์ฐจ์ ํจ์๊ฐ ๋๋ค.
=> Gradient Descent Method (๊ฒฝ์ฌ ํ๊ฐ๋ฒ)
=> ์ปต์ผ ๋๋ง ๊ฒฝ์ฌ ํ๊ฐ๋ฒ์ด ์ ํฉํ๋ค.
Basic Idea
=> ๋ชจ๋ธ์ด ์ง์ ์ด๋ฉด ์ปต์ฒ๋ผ ์๊ฒผ๊ฒ ์ง๋ง, binary classification model ์ ์ปต์ฒ๋ผ ์ด์๊ฒ ์๊ธฐ์ง ์์๋ค.
=> H(x) ,y ๋ ๋ค 0์ด๋ฉด ์๋ฌด๋ฐ ์ฌ๊ฑด์ด ์ผ์ด๋์ง ์์๋ค.
=> y๋ 1์ด๋ฉด ์ฌ๊ฑด์ด ๋ฐ์, H(x)๋ 0 ์ด๋ฉด ์๋ชปํ๋จํ ๊ฒ์ด๋ค.(ai ํ๋ฆผ) => cost๊ฐ ๋ฐ์
=> y=0์ด๋ฉด ์ฌ๊ฑด ๋ฐ์ x, ๊ทธ๋ฌ๋ H(x) ๊ฐ 1์ด๋ฉด ๋ ์๋ชปํ๋จ. => cost ๋ฐ์
=> y=1, H(x)=1 ์ด๋ฉด ์ ํ๋จํ ๊ฒ์ด๋ค. => cost๊ฐ ๋ฐ์ํ์ง ์๋๋ค.
=> A์ธ์ง, B์ธ์ง, C์ธ์ง๋ฅผ ํ๋จํ๋ค.
=> ์๊ทธ๋ชจ์ด๋ ๊ฐ์ด 0.5๋ณด๋ค ํฐ ๊ฒ 2๊ฐ๋ผ๋ฉด? => ์๊ทธ๋ชจ์ด๋ ๊ฐ์ด ํฐ ๊ฒ์ ๊ณ ๋ฅธ๋ค. (๊ฐ์ฅ ์ ์ฌํ ๊ฒ์ ํ๋จ.)
=> ~์ด๋ ์๋๋ : linear combination
=> X๋ ์ธํ ๊ฐ
=> A,B,C ์ค์ ๊ฐ์ฅ ํฐ ๊ฐ์ ์ฐพ๋๋ค.
๋ก๊ทธ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ๋ค.
=> ๊ฐ์ด ์๊ฐ๋ฆฌ๊ฒ ๋๋ฉด cost๊ฐ ๋ฌดํ๋๋ก ๋๋ค.
์ธ๊ณต์ ๊ฒฝ๋ง
๋ฅ๋ฌ๋
Nonlinear Functions
=> ์ด๋ค ์ ํธ๋ ์ฆํญ, ๊ฐ์ ๋๋ ๋ฌด์
=> ์ญ์น๋ฅผ ๋์ผ๋ฉด ์ ํธ๊ฐ ์ ๋ฌ๋์๋ค๊ณ ํ๋จ
=> activation function: ์๊ทธ๋ชจ์ด๋๋ฅผ ์์ฐ๊ณ ํ๋จ
=> hidden layer๋ฅผ ๋ง๋ค์ด์ค๋ค. ๋ง์์ง์๋ก ๊ณ์ฐ์ด ์ ๊ตํด์ง๋ค.
=> hidden layer๊ฐ ๋ง์์ง๋ฉด ๊ธฐ์ค์ ์ด ๋ง์์ง๋ค. ๋ณต์กํ๊ฑฐ๋ฅผ ์ ๋ถ๋ฅํ ์ ์๋ค.
=> hidden layer 1์ ํ๋ ฌ๊ณผ 2์ ํ๋ ฌ์ ์์ ํ ๋ค๋ฅด๋ค.
XOR ์ฐ์ฐ
Multilayer Perceptron(MLP)
=> 100๊ฐ์ layer = 1๊ฐ์ outlayer + 99๊ฐ์ hidden layer
=> A, B๋ ์ธ๋ก๋ก 2๊ฐ ๊ฐ์ด ์์ด์ผ ํ๋ค.
์ด ํ์ตํ๋ ๋ณ์๋?
1x3 3x1
32๊ฐ +9๊ฐ => 41๊ฐ
layer์ ์ ํฉํ ๊ฐฏ์๋ ํด๋ด์ผ ์๋ค.
์์ถ ํจ๊ณผ๊ฐ ์ผ์ด๋์ ์๋ณธ์ ์ฑ์ง์ด ๋จ์ด์ง๋ ๊ฒฝ์ฐ๊ฐ ์๋ค.
input size ๋งํผ layer๋ฅผ ์์์ค์ผ ์๋ณธ์ ์ฑ์ง์ด ๋ณด์ฅ๋๋ค.
layer๋ฅผ ๋ฅํ๊ฒ ์์ผ๋ฉด ์๊ทธ๋ชจ์ด๋๊ฐ ๊ณ์ ๋ถ๊ฒ ๋๋ค.
=> ๋ฐ๋ผ์ ๊ฐ์ด ์ฌ๋ผ์ง๊ฒ ๋๋ค. (The numberous multiplication of this result converges to near zero.)
์๋ฌ์ ๋ฒ์น
์ํซ์ธ์ฝ๋ฉ
์ฌ๋์ ์ ๊ธ์จ์
Hand written images and their label
cell : ํ๋์ ์ธ๊ณต์ ๊ฒฝ๋ง, ์๊ฐ์ ๋ํ ๊ฐ๋ ์ ๋ฃ์ด์ค๋ค.
๊ตฌ์กฐ ์ค๊ณ๊ฐ ์ ์ผ ์ค์ํ๋ค.
๊ฐ์ฅ ํ์ ์ ์ธ ๊ธฐ์
๋ฌด์ธ๊ฐ ์์ฑํ๋ ๊ธฐ์ ์ด๋ค.
๊ฒฝ์์ ํตํด์ ํ์ตํ๋ค.
๋จ์ ์ ์ด๊ธฐ์ ๋๋ฌด ๋๋ฆฌ๋ค.
=> Discriminator ๋ ์ด์ง ๋ถ๋ฅ๊ธฐ๋ค. (์ง๋ํ์ต)
=> Generator model (๋น์ง๋ํ์ต)
PCA => ์ฐจ์์ ์ค์์ง๋ง ๋ชจ์์ ์ต๋ํ ๋จ๊ธฐ๋ ๊ฒ
LDA => ์ฐจ์์ ์ค์ด๊ณ ๋ถ๋ฅํ๊ธฐ ์ ํฉํ๊ฒ
How to overcome?