CS231n - Lecture(1)

이승환·2021년 7월 15일

Computer Vision

목록 보기

1/3

강의소개

CS231n의 경우 스탠포드 대학의 이미지 딥러닝 강의노트이다.
TIL의 하나의 챕터로서 하루에 한강의씩 들으며 생각날때마다 꺼내보기 위해 간단하게 강좌별 요약을 진행하고자 한다.

개요

제 1강을 한마디로 요약하자면 컴퓨터 비전의 개요와 역사이다.
우리는 스마트폰, CCTV, 디지털 카메라 등 기술의 발전으로 이미지 정보가 넘쳐난 세상에 살아가고 있다. 인터넷 트래픽의 80% 이상은 비디오 데이터이며 이 데이터 또한 이미지의 일환이다.

컴퓨터 비전은 이런 이미지를 알고리즘을 통해 이해 하는것을 목표로 한다.

비전의 역사를 생각해보면 비전의 중요성을 더욱 체감 할 수 있다.

여러 5억 4300만년 전 시간의 시작? 에서부터 여러 예시가 나오지만 이 부분에 대해서는 생략하겠다.

1959년 Hubel 과 Wiesel의 연구는 포유류의 시각 처리 방식에 전기 생리학적인 접근했다. 고양이의 뇌에 전극을 꽂아서 어떤 자극에 뉴런이 반응하는지 연구하였고, 서로 다른 도형에 대해 전기 신호가 각 물체에 따른 파형을 띄다는 것을 발견하면서 1차 시각피질에는 다양한 종류의 세포가 있음을 발견하게 된다.

시각을 처리하는 세포가 단순한 구조에서 복잡한 구조를 띄고, 점차 복잡한 구조를 띄면서 반응한다는 것을 알게된 계기가 되었다.

또한 1963년 Larry Roberts의 Block World 는 눈에 보이는 사물들을 기하학적 모양으로 단순화했고, 세상을 시각으로써 인식하고 모양을 단순하게 재구성하는 최초의 컴퓨터 비전 학위 논문을 냈다.

또한 David marr 은 눈으로 인식한 정보를 완전한 입체 형태로 만들기 위해 3단계를 거친다고 주장했다. 자세항 사항은 위 이미지를 참조하면 된다.

추가로 강좌에서 ILSVRC 에 대해서 소개하기도 했다. ILSVRC은 ImageNet Large Scale Visual Recognition Challenge의 약자로 이미지 인식(image recognition) 경진대회이다. 여기서 이미지 인식과 이미지 분류(image classification)는 같은 의미를 갖는다. 대용량의 이미지셋을 주고 이미지 분류 알고리즘의 성능을 평가하는 대회이다. 2010년에 시작되었다. 이 대회에서 우승한 알고리즘들이 컴퓨터 비전 분야 발전에 큰 역할을 해왔다. 이른바 대세 알고리즘들이 되었다.

주목할 만한 점은 대회가 개최된 10년에서부터 17년 이후까지 지속적으로 Steady 하게 성능이 개선되는데, 12년 AlexNet 을 기점으로 딥러닝을 이용한 네트워크가 주목받기 시작하고, 성능이 극적으로 상승했다는 점이다. AlexNet의 경우는 추후에 논문 리뷰 및 예제 코드를 통한 분석을 진행할 예정이다. 사실 이미 일전에 해놓은 상태이다.
놀랍게도 알렉스넷은 이미 1998년 우표인식을 하는 곳에 최초로 딥러닝 네트워크를 활용한 LeNet과 매우 유사하다. LeNet 또한 이미 일전에 분석한 자료가 있으며 추후 업로드할 예정이다.

이 강좌를 통해 CNN에 사용되는 전반적인 이론들을 공부해보고 수식과 파이썬을 이용한 예제코드를 작성해보는 실습을 하고자 하는 것이 목표인 강의라고 할 수 있다.

이승환

Mechanical & Computer Science

다음 포스트

CS231n - Lecture(1)

Computer Vision

강의소개

개요

CS231n - Lecture(2)

0개의 댓글