시계열 모형에는 다양한 구조가 존재하는데, 여기서는 가장 기본적인 MA model(이동평균 모형)에 대해 다루어보도록 하자. MA는 Moving Average(이동평균)의 약자인데, 각 시점의 확률변수는 이전 시점들의 White Noise들로 구성된다. MA(q) 모델은 다음과 같이 주어진다.
Xt=at−θ1at−1−θ2at−2−⋯−θqat−q+μ
여기서 q는 몇개 이전의 시점까지가 영향을 미칠 지 결정하는 모형의 차수이다. 가장 간단한 MA(1) 모형은 다음과 같이 나타난다.
Xt=at−θat−1+μ
Stationarity
MA 모형이 정상성을 가지는지 확인해보면 다음과 같다. 우선 각 시점의 기댓값은 μ로 일정하고 autocovariace function은 다음과 같이 주어진다.
만일 MA(q)에서 q가 무한대로 발산하는 경우의 모형은 어떨지 살펴보자. 이 경우를 Infinite Moving Average Process라고 하는데, 다음과 같이 모형을 정의한다.
Xt=at−θ1at−1−⋯+μj=1∑∞∣θj∣<∞
이 경우 autocovariance function γ(h) 는 다음과 같이 주어진다.
γ(h)=σa2j=0∑∞θjθj−h
Trend Estimation
시계열 모형은 일반적으로 trend component(mt), seasonal component(st), random noise component(yt) 로 구성된다. 즉,
Xt=mt+st+yt
로 주어지는데, yt 부분은 대개 정상시계열 모형으로 주어진다(ex. Moving average Model). 여기서는 우선 계절성 변수가 없다고 가정하고(nonseasonal model), xt=mt+yt 에서 trend component mt를 추정하는 방법을 살펴보도록 하자.
Moving Average Filter
Nonseasonal Model xt=mt+yt 에서 moving window length가 q인 moving average filter는 다음과 같이 정의된다.
wt=2q+11−q∑qXt−j
그러면
wt=2q+11j=−q∑qmt−j+2q+11j=−q∑qyt−j
로 주어진다. 이때 yt 부분은 정상성을 갖는 모형(일종의 random noise)이므로 두번째 항은 사실상 0이 된다. 따라서 우리는 wt 를 mt에 대한 추정값 m^t=wt 로 사용할 수 있다.
Exponential Smoothing
Exponential smoothing은 다음과 같이 점화식의 형태로 주어진다.
{m^t=αXt+(1−α)m^t−1,t=2,⋯m^1=X1
Smoothing Splines
일반적으로 smoothing spline에서는 3차 스플라인(cubic spline)을 사용하는데, 이는 이계도함수 ft′′ 가 존재함을 의미한다. 다음의 regularized form을 최소화하는 함수 ft를 사용한다.
t=1∑n[xt−ft]2+λ∫(ft′′)2dt
여기서 $\lambda >0 $ 는 degree of smoothness인데, 0에 가까워질수록 데이터를 더 strict하게 fitting한다.
Kernel Smoothing
kernel function K(z) 를 사용한 smoothing method를 kernel smoothing이라고 하는데, trend estimand는 다음과 같이 정의된다.
m^t=i=1∑nwi(t)xi
여기서 각 Weight는 커널 함수로부터 다음과 같이 정의된다.
wi(t)=∑jK(bt−j)K(bt−i)
주로 커널 함수는 Gaussian RBF(K(z)=2π1exp(−2z2))가 사용되며 hyperparameter b는 bandwidth로 최적값은 empirical하게 구해진다.