[TIL_Carrotww] 29 - 22/10/13

μœ ν˜•μ„Β·2022λ…„ 10μ›” 13일
0

TIL

λͺ©λ‘ 보기
35/138
post-thumbnail

πŸ“Carrotww의 μ½”λ”© 기둝μž₯

🧲 λ”₯λŸ¬λ‹ CNN

πŸ” ν•©μ„±κ³±
ν•©μ„± κ³±μ΄λž€ μ˜ˆμ „λΆ€ν„° 컴퓨터가 이미지 처리λ₯Ό ν–ˆλ˜ 방식이닀.

μœ„ μž…λ ₯ 데이터 λΆ€λΆ„μ—μ„œ 필터와 같은 크기만큼 λ‚˜λˆˆ ν›„ 각 μƒ‰μ˜ λ„€λͺ¨μΉΈκ³Ό ν•„ν„°μ˜ 같은 캍을 κ³±ν•œν›„ λͺ¨λ‘ λ”ν•˜λ©΄ 좜λ ₯값이 λ‚˜μ˜¨λ‹€.
즉 λΉ¨κ°„ λ„€λͺ¨μΉΈ -> 15
νŒŒλž€ λ„€λͺ¨μΉΈ -> 16
...

μœ„ 합성곱을 λ”₯λŸ¬λ‹μ—μ„œ μ‚¬μš©ν•  수 있게 ν•΄μ€€ 논문이닀.
λ₯΄μΏ€ κ΅μˆ˜λŠ” μœ„ 신경망 λ””μžμΈμ„ ν•©μ„±κ³± 신경망(CNN) 이라고 λͺ…μΉ­ν•˜μ˜€μœΌλ©° 이미지 μ²˜λ¦¬μ—μ„œ μ—„μ²­λ‚œ μ„±λŠ₯을 보여쀀닀.
ν•΄λ‹Ή κ΅¬μ‘°λŠ” 이미지 μ²˜λ¦¬μ—μ„œ ν˜„μž¬ κ°€μž₯ 보편적으둜 μ‚¬μš©λ˜λŠ” λ„€νŠΈμ›Œν¬ ꡬ쑰이닀.

🧲 ν•©μ„±κ³± μ‹ κ²½λ§μ˜ ν•©μ„±κ³± 계측(Convolution layer)


μœ„ 그림처럼 5 5 크기의 μž…λ ₯을 3 3의 ν•„ν„°λ₯Ό μ‚¬μš©ν•˜μ—¬ 합성곱을 ν•˜λ©΄ 3 * 3 크기의 νŠΉμ„±λ§΅μ΄ λ‚˜μ˜€λ©°, μœ„ κ·Έλ¦Όκ³Ό 같이 μ΄λ™ν•˜λŠ” 간격을 'μŠ€νŠΈλΌμ΄λ“œ(stride)' 라고 ν•œλ‹€.
계속 연산을 ν•˜κ²Œλ˜λ©΄ νŠΉμ„± 맡의 크기가 계속 μ€„μ–΄λ“œλŠ” ν˜„μƒμ΄ λ‚˜νƒ€λ‚˜κ³ , 이λ₯Ό λ°©μ§€ν•˜κ³ μž νŒ¨λ”© λ˜λŠ” λ§ˆμ§„ 을 μ£Όμ–΄ μŠ€νŠΈλΌμ΄λ“œκ°€ 1일 λ•Œ μž…λ ₯κ°’κ³Ό νŠΉμ„± 맡의 크기λ₯Ό κ°™κ²Œ λ§Œλ“€ 수 μžˆλ‹€.
μœ„ κ·Έλ¦Όκ³Ό 같이 3μ°¨μ›μ—μ„œλ„ κ°€λŠ₯ν•˜λ‹€.

🧲 CNN ν™œμš©

πŸ” 물체 인식
Yolo λͺ¨λΈ ν…ŒμŠ€νŠΈ github 링크

yoloλŠ” 맀우 λΉ λ₯Έκ³  정확도가 λ†’κΈ° λ•Œλ¬Έμ— λͺ¨λ°”일 λ“± μ—¬λŸ¬ λΆ„μ•Όμ—μ„œ μ‚¬μš©μ€‘μ΄λ‹€.

πŸ” 이비지 λΆ„ν• 

μ΄λ―Έμ§€μ—μ„œ 각 μ˜€λΈŒμ νŠΈκ°€ μ†ν•œ 픽셀을 λΆ„λ¦¬ν•˜μ—¬ μ²˜λ¦¬ν•΄ μ£ΌλŠ” 것이닀.

  • μœ„ 두 κΈ°μˆ μ„ μ΄μš”ν•˜μ—¬
    μžμœ¨μ£Όν–‰μ—μ„œμ˜ 물체 인식, μžμ„Έ 인식, ν™”μ§ˆ κ°œμ„  λ“± ν™œμš©λ  수 μžˆλŠ” λΆ„μ•Όκ°€ λ§Žλ‹€.

🧲 GAN

πŸ” CNN의 ν•œ μ’…λ₯˜λ‘œ μ—¬λŸ¬ ν™œμš©λœ μ’…λ₯˜κ°€ μžˆμ—ˆμ§€λ§Œ GAN이 κ°€μž₯ νŠΉμ΄ν•˜κ³  μž¬λ°Œμ–΄μ„œ 정리해본닀.

πŸ’‘ Generative Adversarial Network (GAN) μ΄λž€
μ„œλ‘œ μ λŒ€ν•˜λŠ” κ΄€κ³„μ˜ 2가지 λͺ¨λΈμ„ λ™μ‹œμ— μ‚¬μš©ν•˜λŠ” κΈ°μˆ μ΄λ‹€.
μ λŒ€ κ΄€κ³„λž€ 이미지λ₯Ό μƒμ„±ν•˜λŠ” μƒμ„±μž, ν•΄λ‹Ή 이미지λ₯Ό νŒλ³„ν•˜λŠ” μ‹λ³„μž 두 λͺ¨λΈμ„ μ‚¬μš©ν•˜λŠ” 것인데, 보톡 μƒμ„±μžλ₯Ό ν•™μŠ΅μ‹œκΈ°ν‚€ μœ„ν•΄ μ‚¬μš©ν•œλ‹€.

μœ„ κ·Έλ¦Όκ³Ό 같이 μƒμ„±μžκ°€ μœ„μ‘° 지폐λ₯Ό μƒμ„±ν•œλ‹€κ³  예λ₯Ό λ“€λ©΄ μ‹λ³„μžλŠ” 이λ₯Ό νŒλ³„ν•˜λŠ” 경찰이닀. κ·Έλ ‡λ‹€λ©΄ GAN 은 μœ„ ν–‰μœ„λ₯Ό 계속 λ°˜λ³΅ν•˜μ—¬ μƒμ„±μžλŠ” λ”μš± 지폐같은 μœ„μ‘° 지폐λ₯Ό, μ‹λ³„μžλŠ” λ”μš± μ •κ΅ν•˜κ²Œ νŒλ³„ν•˜λŠ” νŒλ³„ λͺ¨λΈμ΄ λ§Œλ“€μ–΄ μ§€κ²Œ λ˜λŠ” 것이닀.

λ™λ¬Όμž„μ„ νŒλ³„ν•˜λŠ” μ‹λ³„μž, λ§Œλ“€μ–΄λ‚΄λŠ” μƒμ„±μžκ°€ μžˆλ‹€λ©΄ μœ„μ™€ 같이 input은 random κ°’, output은 0은 κ°€μ§œ 1은 μ§„μ§œλ‘œ μ£Όμ–΄μ§€κ²Œ μ„€κ³„ν•˜μ—¬

μƒμ„±μžλŠ” output이 1이 λ‚˜μ˜€κ²Œ λ…Έλ ₯ν•˜κΈ° μœ„ν•΄ 1κ³Ό 예츑의 차이인 손싀을 쀄이기 μœ„ν•˜μ—¬ Backpropagation을 μ΄μš©ν•œ weightλ₯Ό μ‘°μ •ν•  것이닀.

μ‹λ³„μžλŠ” κ°€μ§œ 이미지와, μ§„μ§œ 이미지λ₯Ό λͺ¨λ‘ ν•™μŠ΅ν•˜μ—¬ input 예츑과 νƒ€κΉƒμ˜ 손싀을 쀄여 λ‚˜κ°€λ©° ν•™μŠ΅ν•  것이닀.

μœ„ ν–‰μœ„λ₯Ό λ°˜λ³΅ν•˜μ—¬ 두 λͺ¨λΈμ΄ λŒ€λ¦½ν•˜μ—¬ 에폭이 μ§€λ‚ λ•Œλ§ˆλ‹€ λ”μš± μ •κ΅ν•˜κ²Œ μƒμ„±ν•΄λ‚˜κ°ˆ 것이닀.

profile
Carrot_hyeong

0개의 λŒ“κΈ€