네이버 부스트캠프 5기 5일차

김태민·2023년 3월 12일
1

boostcamp1week

목록 보기
5/5

CNN

주로 이미지 데이터를 처리할때 사용한다

Convolution

컨볼루션은 일종의 필터라고 볼 수 있다. input_image를 슬라이딩하면서 새로운 Feature Map을 만들게 된다.

Color image_conv

만약 컨볼루션 레이어를 컬러이미지에 적용하게 된다면 위의 사진과 같이 3개의 필터를 만들고 각각 Feature Map을 생성 그리고 합 연산으로 1차원의 Feature Map을 추출하게 된다.

Padding & Stride


padding은 간단하게 이미지의 외각에 0으로된 픽셀값을 추가하여 최종적인 Feature Map의 크기를 조정 가능하게끔한다.
stride는 컨볼루션 레이어가 일반적으로 1칸씩 슬라이딩을 하게되는 이를 조정하여 2칸씩 3칸씩 슬라이딩이 가능하게끔 수정할수 있다.

Feature Map Size

최종적인 Feature Map의 Size는 위의 수식과 같이 계산된다.

RNN

주로 시퀀스 데이터(소리,문자열,주가) 데이터를 처리할때 활용된다.
히든 노드가 방향을 가진 엣지로 구성되어 순환구조를 이룬다.

RNN의 기본 구조

만약 h e l l 이 input이라면 입력과 출력을 매칭시켜보면 h->e, e->l, l->l, l->o 순으로 l은 입력이라도 순서에 따라 출력값이 다른것을 볼 수 있다.

RNN의 순전파

rnn의 순전파 같은 경우는 위의 식을 볼경우 hth_{t} = tanh(Whhht1+Wxhxt+bh)tanh(W_{hh}h_{t-1} +W_{xh}x_{t} + b_{h}) ,yt=Whyht+by,y_{t} = W_{hy}h_{t} + b_{y}이다 이때 hth_{t}는 현재입력 xtx_{t} 와 입력에 대한 가중치 WxhW_{xh}를 곱해주고 다시
과거 t1t-1의 노드의 입력 ht1h_{t-1}과 그에 대한 가중치 WhhW_{hh}를 곱연산 해주고 좀 전에 계산한 식과 더해준다 그리고 바이어스 bhb_{h}를 더해주어 현재 시점의 hth_{t}를 계산해준다.
yty_{t} 는 현재 hth_{t}의 출력값과 가중치 WhyW_{hy}를 곱해주고 출력에 대한 바이어스 byb_{y}를 더해주어 최종적인 출력을 뽑아낸다.

기울기 소실

일반적으로 RNN은 시퀀스 길이가 길어지는 경우 그리고 관련 정보와 그 정보를 사용하는 지점 사이 거리가 멀 경우 vanishing gradient problem이 발생하게 됨으로 아래와 같은 모델들이 있다.

회고

이번에는 그나마 익숙했던 RNN 과 CNN에 대해 공부해보았다. 비록 이 글에 역전파가 설명되어있진 않지만 나중에 작성하도록 하겠다.
첫주를 그래도 하루도 빠짐없이 글을 작성하고 공부를 해서 꾸준함이 유지 되었다고 생각된다. 이대로 계속 가면 문제가 없을것같다.

profile
한성대학교 네이버 AI Tech 5기 NLP

1개의 댓글

comment-user-thumbnail
2023년 3월 14일

우왕 멋지다ㅏ~~

답글 달기