Boostcamp-221012 학습정리

권규보·2022년 10월 12일
0

boostcamp

목록 보기
4/9

Why is visual perception important?

사람은 지각을 통해 세상과 상호작용한다.
우리 스스로 우리 감각의 사용법을 명확하게 알고 있나?
잘 알지 못해서 이걸 기계로 구현하는 문제가 단순한 문제가 아님. 인공지능을 구현하기 위해서 perception이 불안하다면 사고도 불안할 것임. 그래서 지각이 중요함.

시각이 중요한 이유? 우리는 시각에 가장 많이 의지하면서 살아가고 있음.

What is computer vision?

사람의 시각적 지각 과정
visual world -> sensing device -> interpreting device -> interpretation

컴퓨터 관점에서도 마찬가지임. 대신 sensing device가 카메라가 되고, interpreting device에서 GPU와 algorithm으로 함.

마지막에 나오는 컴퓨터의 interpretation을 다시 장면으로 구현하는 것을 Computer Graphics(Rendering)이라고 함. computer visiond은 rendering의 반대임.

사람의 시각 능력을 이해를 잘하는 것이 중요함. 사람의 시각의 치명적인 불안정성을 아는 것이 중요함. ex) 눈과 입이 뒤집어진 사진을 거꾸로 뒤집어 놓으면 그닥 이상한 점을 못느낌. 이건 우리가 거꾸로 되어있는 것을 볼 기회가 많이 없어 bias되어 학습 되어 있다고 해석할 수 있지 않나.

사람의 구조를 모방하는 것이 결국 가장 기본적인 시작이 되었음.

어떻게 하면 이런 구조를 구현할 수 있을까?
원래는 전문가가 특징을 추출해서 classification 시키는 머신러닝 방법을 이용했다면 지금은 이 특징을 추출하는 것을 사람이 하지 않고 그냥 deep learning에 넣어버리고 있음. 사람이 간과하는 특징이 있을 확률이 엄청 높기 때문에 이게 사람보다 훨씬 낫다.

2.1 what is classificaiton

입력이 영상, 출력이 그 영상에 해당하는 카테고리(클래스)

2.2 An ideal approach for image rocognition

만약 내가 모든 데이터를 다 갖고 있으면 새로운 것이 들어와도 지금 내가 갖고 있는 것 중 가장 비슷한 것을 찾아서 내놓으면 됨.

K-NN(K Nearest Neighbors)

데이터를 다 갖고 있으면 영상분류 문제가 검색 문제로 바뀌게 됨.
근데 데이터가 너무 많으면 시스템 복잡도 때문에 K-NN 방법을 써먹을 수가 없음. 이런 걸 Neural Network에 녹여내는 것이 딥러닝임.

2.3 CNN

Fully connected layer의 사진의 모든 부분을 갖고 특징을 추출해야하는 단점을 보완.
파라미터도 적음.

profile
기록장

0개의 댓글