KeepGoing
로그인
KeepGoing
로그인
CNN의 시작
민서
·
2023년 9월 9일
팔로우
0
CNN
ML/DL
0
CNN은 이미지와 같이 지역적인 패턴과 구조가 중요한 데이터를 처리하기 위해 설계된 신경망 모델이다.
이미지를 flatten 하여 MLP학습은 가능하나, 펼치는 행위에서 이미지의 지역정보(topological information)가 손실되며, 추상화없이 바로 연산을 하므로 학습 시간과 능률에 있어 매우 비효율적이다.
때문에 이미지의 지역정보를 잘 살릴 수 있는 receptive field concept를 이용한 CNN이 도입되었다
네트워크가 깊어지면(layer가 많아지면) 성능향상의 가능성이 생긴다.
중첩된 convolution 연산으로 인해 상위 레이어 각 뉴런 입력의 receptive field는 점점 커지게 되고, 따라서 중요한 맥락정보(Contextual Information)를 학습할 수 있고, 복잡한 패턴과 같은 고수준 특징을 얻을 수 있기 때문이다.
가능성이 생긴다는 것은, 일반적으로 layer를 많이 쌓아나가는 것은 학습데이터를 과하게 학습하는 overfitting의 원인이 되기때문이다.
그렇기 때문에 layer를 많이 쌓으면서 과적합을 방지할 수 있는 방법을 제안하여 CNN성능향상 가능성을 실현해온게 CNN의 발전방향성 중 하나이다.
앞으로
CNN의 논문을 훑으면서 CNN의 발전과정을 다뤄볼 것이다.
민서
실패보다 사람을 더 미치게 하는게 후회더라구요 // 공부는 티스토리에, 생각은 벨로그에, 일상은 네이버에 기록합니다
팔로우
이전 포스트
지도학습
다음 포스트
[CNN]AlexNet 논문 리뷰
0개의 댓글
댓글 작성