Convolutional Neural Networks(합성곱 신경망)
완전 연결 신경망은 이미지 데이터 학습을 위해 1차원 평탄화 필요
이미지 데이터가 가지고 있던 "형상 정보" 사라지며 무시될 수 있음.
(ex: 사람 얼굴을 생각해보면, 얼굴구조에 대한 정보 사라짐)
형상 정보: “이미지의 가까운 픽셀은 비슷한 값을 가진다” or “거리가 먼 픽셀끼리는 큰 연관성이 없다”와 같은 공간적 정보를 의미
이미지 입력 후 합성곱에 해당하는 연산으로 모델 구조를 정해 놓아, 형상 정보를 유지: CNN 등장!
입력 데이터에 필터(Filter) 혹은 커널(Kernel)를 적용하여 윈도우(Window)를 일정 간격으로 이동해가며 수행
입력 데이터에 필터를 적용할 때 필터가 이동하는 간격
합성곱 연산을 수행하기 전에 입력 데이터 주변을 특정 값(주로 0)으로 채우는 연산
합성곱 연산을 반복하면 피처맵의 크기가 점점 줄어들어 결국 피처맵의 크기가 1이 될 수 있다. 너무나 작은 피처맵은 합성곱 신경망의 학습을 효율적으로 진행시키지 못 한다. 이러한 문제를 방지하기 위해 패딩을 사용
입력하는 이미지의 크기를 (H,W), 필터 크기를 (FW, HW), 출력의 크기를 (OH, OW), 패딩을 P, 스트라이드를 S라고 가정하면 출력 크기(OH, OW)는 다음과 같이 계산가능
이미지 데이터의 가로, 세로 방향의 크기를 줄이는 연산으로 피처맵에서 중요한 정보를 추출하기 위해 사용
종류: 최대풀링,평균풀링
주어진 윈도우 내에서 가장 큰 값을 선택한다. 도출된 특징이 가장 두드러지게 표현된다. 일부 노이즈에 대해서는 덜 민감하게 반응할 수 있다. 다만, 평균적인 정보나 배경 정보를 손실할 수 있다.
주어진 윈도우 내의 모든 값의 평균을 계산한다. 피처 맵의 일반적인 정보를 보존한다. 특징 맵의 극단적인 값에 덜 민감하다. 다만, 도드라진 특징이 덜 강조될 수 있다.