RNN과 시계열데이터

Yougurt_Man·2022년 4월 4일

RNN 시계열

Deep Learning

목록 보기

5/7

Back Ground

시계열 데이터: 어떤 데이터의 변화가 시간에 종속되는 데이터
- Non-Stationarity 를 가진다.
시계열을 다루기위해서는, 시간에 따라 변화되는 데이터 요소를 제거해야한다.

RNN (순환 신경망)

출처: https://yjs-program.tistory.com/164

Recurrent Neural Networks (RNN) are a class of Artificial Neural Networks that can process a sequence of inputs in deep learning and retain its state while processing the next sequence of inputs. Traditional neural networks will process an input and move onto the next one disregarding its sequence. Data such as time series have a sequential order that needs to be followed in order to understand. Traditional feed-forward networks cannot comprehend this as each input is assumed to be independent of each other whereas in a time series setting each input is dependent on the previous input.

RNN이란, 입력들의 시퀀스 (순차적이고 연속적인 데이터)를 처리하고, 다음 입력의 시퀀스를 처리하는동안 입력받은 데이터를 게속 유지하는 인공신경망 클래스이다.

전통적인 Feed Forward 네트워크는 입력데이터가 시퀀셜 하더라도 서로 독립적으로 데이터를 처리하기 때문에, 서로간의 데이터가 종속적인 시계열에서는 사용하기 어려웠다. RNN 네트워크는 이러한 시퀀스 데이터를 처리하기위해서 사용되고, 대표적인 시퀀스 데이터는 자연어 처리가 존재한다.

참고: 또한, 이미지도 대표적인 Non-stationarity를 가지므로, 시계열 데이터의 일종으로 표현가능하다고 한다. 그러므로, 어떠한 시퀀스 데이트럴 다루어야 하는 RNN 알고리즘도 이미지 처리에 탁월한 성능을 보여준다고 한다.

아래는, RNN에서 중요하다고 생각되는 키워드이다.

시퀀스모델: 문장과 같은 시퀀스 데이터를 처리
셀(Cell): 이전 값을 기억하는 RNN의 기억 장치. Activation Function 이후 값을 출력하는 노드. 메모리 셀 또는 RNN 셀이라고 불린다. 현재 시점 t에서의 데이터는, 이전 시점 t-1의 데이터를 포함하기에, 기억하고있다고 말할수 있다.
은닉상태 (Hidden State): 메모리 셀에서 출력된 값을 다음 입력으로 보내주는 값
재귀적: 활성화 함수를 지난 출력값을 다음 은닉층의 입력으로 값을 포워딩 함