8. 딥러닝 알고리즘

YJ·2023년 9월 30일

(7장에 이어)

- 이미지 처리 시 사용 - 하나의 픽셀 => 하나의 feature - DNN 시 단점: input 이미지를 1차원으로 처리해야 함 (위치정보 소실 가능성), input 사이즈가 커지면 학습이 필요한 가중치가 증가함

특징 추출 영역
: Convolution Layer(각 이미지를 Feature Map이라 지칭함) 및
Pooling Layer(특징 크기 축소시킴) 여러 겹 쌓는 형태

클래스 분류 영역: Fully Connected Layer로 최종 결과값을 출력해내는 것
(여기서부터는 DNN과 동일한 알고리즘)

- 자연어 처리 시 사용 - 입출력을 Sequential하게 처리함 - 순환구조

h_t = tanh(v*h_(t-1) + u*x_(t) + b_h)

o_t = tanh(w*h_(t-1) + b_o)

RNN의 문제점(옆으로 보내는 정보(ex 토큰)(위 그림에서의 h)와 이 정보를 사용하는 지점의 거리가 멀 경우, 역전파 시 Gradient가 줄고 학습능력이 저하됨)
- 즉, 문장의 길이가 길수록 학습능력이 저하 됨
해당 문제점을 보완하기 위해 등장한 것이 LSTM
cell state(기억해야 할 정보의 상태)가 존재하고, 길이가 긴 input도 처리 가능하도록 설계 됨

💻귀찮으니 필요할 때만 쓰는 Computer Vision 일지 ㅇㅇ💻