네이버 부스트캠프 5기 5일차

김태민·2023년 3월 12일

AI NLP 네이버 부스트캠프

boostcamp

목록 보기

6/36

CNN

주로 이미지 데이터를 처리할때 사용한다

Convolution

컨볼루션은 일종의 필터라고 볼 수 있다. input_image를 슬라이딩하면서 새로운 Feature Map을 만들게 된다.

Color image_conv

만약 컨볼루션 레이어를 컬러이미지에 적용하게 된다면 위의 사진과 같이 3개의 필터를 만들고 각각 Feature Map을 생성 그리고 합 연산으로 1차원의 Feature Map을 추출하게 된다.

Padding & Stride

padding은 간단하게 이미지의 외각에 0으로된 픽셀값을 추가하여 최종적인 Feature Map의 크기를 조정 가능하게끔한다.
stride는 컨볼루션 레이어가 일반적으로 1칸씩 슬라이딩을 하게되는 이를 조정하여 2칸씩 3칸씩 슬라이딩이 가능하게끔 수정할수 있다.

Feature Map Size

최종적인 Feature Map의 Size는 위의 수식과 같이 계산된다.

RNN

주로 시퀀스 데이터(소리,문자열,주가) 데이터를 처리할때 활용된다.
히든 노드가 방향을 가진 엣지로 구성되어 순환구조를 이룬다.

RNN의 기본 구조

만약 h e l l 이 input이라면 입력과 출력을 매칭시켜보면 h->e, e->l, l->l, l->o 순으로 l은 입력이라도 순서에 따라 출력값이 다른것을 볼 수 있다.

RNN의 순전파

rnn의 순전파 같은 경우는 위의 식을 볼경우 $h_{t}$ = $tanh(W_{hh}h_{t-1} +W_{xh}x_{t} + b_{h})$ $,y_{t} = W_{hy}h_{t} + b_{y}$ 이다 이때 $h_{t}$ 는 현재입력 $x_{t}$ 와 입력에 대한 가중치 $W_{xh}$ 를 곱해주고 다시
과거 $t-1$ 의 노드의 입력 $h_{t-1}$ 과 그에 대한 가중치 $W_{hh}$ 를 곱연산 해주고 좀 전에 계산한 식과 더해준다 그리고 바이어스 $b_{h}$ 를 더해주어 현재 시점의 $h_{t}$ 를 계산해준다.
$y_{t}$ 는 현재 $h_{t}$ 의 출력값과 가중치 $W_{hy}$ 를 곱해주고 출력에 대한 바이어스 $b_{y}$ 를 더해주어 최종적인 출력을 뽑아낸다.