π ν©μ±κ³±
ν©μ± κ³±μ΄λ μμ λΆν° μ»΄ν¨ν°κ° μ΄λ―Έμ§ μ²λ¦¬λ₯Ό νλ λ°©μμ΄λ€.
μ μ λ ₯ λ°μ΄ν° λΆλΆμμ νν°μ κ°μ ν¬κΈ°λ§νΌ λλ ν κ° μμ λ€λͺ¨μΉΈκ³Ό νν°μ κ°μ μΊμ κ³±νν λͺ¨λ λνλ©΄ μΆλ ₯κ°μ΄ λμ¨λ€.
μ¦ λΉ¨κ° λ€λͺ¨μΉΈ -> 15
νλ λ€λͺ¨μΉΈ -> 16
...
μ ν©μ±κ³±μ λ₯λ¬λμμ μ¬μ©ν μ μκ² ν΄μ€ λ Όλ¬Έμ΄λ€.
λ₯΄μΏ€ κ΅μλ μ μ κ²½λ§ λμμΈμ ν©μ±κ³± μ κ²½λ§(CNN) μ΄λΌκ³ λͺ μΉνμμΌλ©° μ΄λ―Έμ§ μ²λ¦¬μμ μμ²λ μ±λ₯μ 보μ¬μ€λ€.
ν΄λΉ ꡬ쑰λ μ΄λ―Έμ§ μ²λ¦¬μμ νμ¬ κ°μ₯ 보νΈμ μΌλ‘ μ¬μ©λλ λ€νΈμν¬ κ΅¬μ‘°μ΄λ€.
μ κ·Έλ¦Όμ²λΌ 5 5 ν¬κΈ°μ μ λ ₯μ 3 3μ νν°λ₯Ό μ¬μ©νμ¬ ν©μ±κ³±μ νλ©΄ 3 * 3 ν¬κΈ°μ νΉμ±λ§΅μ΄ λμ€λ©°, μ κ·Έλ¦Όκ³Ό κ°μ΄ μ΄λνλ κ°κ²©μ 'μ€νΈλΌμ΄λ(stride)' λΌκ³ νλ€.
κ³μ μ°μ°μ νκ²λλ©΄ νΉμ± λ§΅μ ν¬κΈ°κ° κ³μ μ€μ΄λλ νμμ΄ λνλκ³ , μ΄λ₯Ό λ°©μ§νκ³ μ ν¨λ© λλ λ§μ§ μ μ£Όμ΄ μ€νΈλΌμ΄λκ° 1μΌ λ μ λ ₯κ°κ³Ό νΉμ± λ§΅μ ν¬κΈ°λ₯Ό κ°κ² λ§λ€ μ μλ€.
μ κ·Έλ¦Όκ³Ό κ°μ΄ 3μ°¨μμμλ κ°λ₯νλ€.
π 물체 μΈμ
Yolo λͺ¨λΈ ν μ€νΈ github λ§ν¬
yoloλ λ§€μ° λΉ λ₯Έκ³ μ νλκ° λκΈ° λλ¬Έμ λͺ¨λ°μΌ λ± μ¬λ¬ λΆμΌμμ μ¬μ©μ€μ΄λ€.
π μ΄λΉμ§ λΆν
μ΄λ―Έμ§μμ κ° μ€λΈμ νΈκ° μν ν½μ μ λΆλ¦¬νμ¬ μ²λ¦¬ν΄ μ£Όλ κ²μ΄λ€.
- μ λ κΈ°μ μ μ΄μνμ¬
μμ¨μ£Όνμμμ 물체 μΈμ, μμΈ μΈμ, νμ§ κ°μ λ± νμ©λ μ μλ λΆμΌκ° λ§λ€.
π CNNμ ν μ’ λ₯λ‘ μ¬λ¬ νμ©λ μ’ λ₯κ° μμμ§λ§ GANμ΄ κ°μ₯ νΉμ΄νκ³ μ¬λ°μ΄μ μ 리ν΄λ³Έλ€.
π‘ Generative Adversarial Network (GAN) μ΄λ
μλ‘ μ λνλ κ΄κ³μ 2κ°μ§ λͺ¨λΈμ λμμ μ¬μ©νλ κΈ°μ μ΄λ€.
μ λ κ΄κ³λ μ΄λ―Έμ§λ₯Ό μμ±νλ μμ±μ, ν΄λΉ μ΄λ―Έμ§λ₯Ό νλ³νλ μλ³μ λ λͺ¨λΈμ μ¬μ©νλ κ²μΈλ°, λ³΄ν΅ μμ±μλ₯Ό νμ΅μκΈ°ν€ μν΄ μ¬μ©νλ€.
μ κ·Έλ¦Όκ³Ό κ°μ΄ μμ±μκ° μμ‘° μ§νλ₯Ό μμ±νλ€κ³ μλ₯Ό λ€λ©΄ μλ³μλ μ΄λ₯Ό νλ³νλ κ²½μ°°μ΄λ€. κ·Έλ λ€λ©΄ GAN μ μ νμλ₯Ό κ³μ λ°λ³΅νμ¬ μμ±μλ λμ± μ§νκ°μ μμ‘° μ§νλ₯Ό, μλ³μλ λμ± μ κ΅νκ² νλ³νλ νλ³ λͺ¨λΈμ΄ λ§λ€μ΄ μ§κ² λλ κ²μ΄λ€.
λλ¬Όμμ νλ³νλ μλ³μ, λ§λ€μ΄λ΄λ μμ±μκ° μλ€λ©΄ μμ κ°μ΄ inputμ random κ°, outputμ 0μ κ°μ§ 1μ μ§μ§λ‘ μ£Όμ΄μ§κ² μ€κ³νμ¬μμ±μλ outputμ΄ 1μ΄ λμ€κ² λ Έλ ₯νκΈ° μν΄ 1κ³Ό μμΈ‘μ μ°¨μ΄μΈ μμ€μ μ€μ΄κΈ° μνμ¬ Backpropagationμ μ΄μ©ν weightλ₯Ό μ‘°μ ν κ²μ΄λ€.
μλ³μλ κ°μ§ μ΄λ―Έμ§μ, μ§μ§ μ΄λ―Έμ§λ₯Ό λͺ¨λ νμ΅νμ¬ input μμΈ‘κ³Ό νκΉμ μμ€μ μ€μ¬ λκ°λ©° νμ΅ν κ²μ΄λ€.
μ νμλ₯Ό λ°λ³΅νμ¬ λ λͺ¨λΈμ΄ λ립νμ¬ μνμ΄ μ§λ λλ§λ€ λμ± μ κ΅νκ² μμ±ν΄λκ° κ²μ΄λ€.