[CS231N] Lecture 1 Introduction to Convolutional Neural Networks for Visual Recognition

LeeJaeJun·2022년 1월 17일
0

CS231N

목록 보기
1/1
post-thumbnail

📖 비전의 역사

비전(시각정보)의 시작

  • 5억 4년만년전 눈(eye)이 처음으로 만들어지고 빠른 속도로 진화하기 시작하였다.

시각정보를 연구하기위해

  • 사람과 시각 정보를 비슷하게 받아드리는 고양이 뇌를 활용하여 연구하기 시작함.
  • 경계 (edge)가 변경되면 반응하는 세포가 있는것을 알아냈고 시각정보는 주로 경계에 의하여 알게되는 것을 확인함.
  • 처음에는 단순한 시각정보(경계)로 시작하지만, 통로를 점차 지나면서 구체적인 시각정보(표면, 깊이 정보, 레이어)로 변경됨.
  • 위 과정을 거치면 최종적으로 3D모델이 완성된다.

어떤 시도를 해보았는가?

  1. 복잡한 객체를 단순화 하는 과정부터 시작했다. 원형 모양으로 단순화 하거나 관절을 기준으로 선을 그어 연결하거나와 같은 단순화 방법을 제시하였다. ( 다만 위 방법들이 잘 통하지 않은듯?!)
  2. 그래도 얼굴인식 알고리즘은 빠른속도로 발전하고 있었다.
  3. 큰 구조를 인식하지 못하자 객체를 나눠서 인식하는 방법을 먼저 찾아보기로하였다. ( Feature의 등장 )
  4. 피처를 사용하여 구분하면 풍경사진, 인물사진 등 사진의 종류는 서포트 벡터 머신을 통해 구분하기 쉬웠다. ( 사진 화질의 증가는 비전 기술에 큰 도움이 되었음. 좋은 다양한 소스를 쉽게 구함 )

세상 모든 객체를 인식할 준비가 되었는가?

  1. 이때만해도 오버피팅 문제가 크게 발생함. 자료가 많이 없어서 오버피팅 문제가 계속 발생하자 ImageNet을 만들기 시작했는데 이는 엄청나게 많은 양의 데이터(이미지, 라벨)를 인터넷을 통해 모은 데이터셋 ImageNet(이미지), WordNet(라벨)을 만들기 시작함. 그렇게 22만가지 클래스가 모인 정제된 데이터셋이 탄생함.
  2. ImageNet을 활용하여 알고리즘 대회를 개최하였는데, 2010년에는 28%의 오류를 맴돌던 수치가 2012년에 반토막으로 감소하고 2015년 사람보다 더 나은 상황까지 오게되었다. 2012년 수치를 반토막내던 알고리즘이 바로 CNN이다. 당시 우승하였다.

📐 수업의 방향성

  • 객체 분석과 객체 라벨링을 학습함으로서 비전 알고리즘에 대해 학습함. 그리고 CNN 알고리즘에 대해 자세하게 공부해나갈 예정임. CNN을 바탕으로 레어이가 늘어나거나 튜닝되어갔던 과정들에 대해서도 공부해 나갈 예정이다.
  • CNN은 사실 2012년에 탄생한 아키텍쳐는 아니다. 1998년도 부터 등장했던 알고리즘이다. 허나 당시에는 계산속도와 GPU의 발전도가 낮음으로 알고리즘을 실현시키기에 한계가 있었다. 또한 크고 다양한 데이터를 구하기가 매우 어렵기도하였다.
  • 컴퓨터 비전은 아직까지 갈길이 멀다. 단순하게 이미지를 보고 판단하는 것 뿐만 아니라 어떤 행동을 하고 있고, 어떤행동을 통해 “왜 저 사람은 웃고 있는가?”에 대하여 판단하는 등 여러 발전이 기대되는 분야이다.

0개의 댓글