시계열 분석 기법과 응용(1. 시계열 평활기법)

skh951225·2022년 9월 6일
0

강의주소

시계열 분석(Time Series Analysis)

  • 하나의 변수에 대한 시간에 따른 관측치를 시계열 또는 시계열 데이터라 함
  • 시계열 분석 목적
    - 시계열의 특성(추세, 계절성 등)을 요약하고 시간에 따른 패턴 (자기 상관성 등) 분석
    • 시간에 따른 패턴을 바탕으로 모형화하고 미래값을 예측
  • 회귀모형과는 달리 다른 변수를 도입하지 않고 자신의 변수의 과거 패턴이 미래에도 계속 된다는 가정하에 변수의 과거값을 바탕으로 미래값 예측
  • 시계열 패턴은 수평, 추세, 계절성이 복합된 것으로 간주

이동평균법

  • 매 시점에서 직전 N개 데이터의 평균을 산출하여 평활치로 사용

단순 이동평균법

  • 시계열 데이터 {X1,X2...}\{X_1,X_2...\}가 수평적 패턴인 경우 사용
  • 시점 t 에서의 단순 이동 평균
    Mt=1NΣk=tN+1tXkM_t = {1\over N}\Sigma_{k=t-N+1}^tX_k
  • 시점 t 에서의 단순 이동 평균
    Mt+1=Mt+Xt+1XtN+1NM_{t+1} = M_t+{{X_{t+1}-X_{t-N+1}}\over N}
  • 시점 T에서 시점 T+1의 값 예측
    fT,1=MTf_{T,1}=M_T
  • N이 클수록 평활화 효과가 커짐

이중 이동평균법

  • 시계열 데이터 {X1,X2...}\{X_1,X_2...\}가 선형추세인 경우 사용
    Xt=c+bt+atX_t=c+bt+a_t
  • 단순 이동평균은 추세를 늦게 따라감
    E[Mt]=E[1NΣk=tN+1tc+bk+ak]=c+btbNN(N1)2=c+btb(N1)2E[M_t]=E[{1\over N}\Sigma_{k=t-N+1}^tc+bk+a_k]=c+bt-{b\over N}{N(N-1)\over 2} = c+bt-{b(N-1)\over 2}
  • 이중 이동 평균 : Mt(2)=1NΣk=tN+1tMkM_t^{(2)} = {1\over N}\Sigma_{k=t-N+1}^tM_k
    E[Mt(2)]=c+btb(N1)E[M_t^{(2)}]= c+bt-b(N-1)
  • 시점 T에서 시점 T+1의 값 예측
    fT,1=E[XT+1XT,XT1...]=c+b(T+1)f_{T,1}=E[X_{T+1}|X_T,X_{T-1}...] = c+b(T+1)
    f^T,1=c^+b^(T+1)=2MTMT(2)+b^\hat f_{T,1} = \hat c+\hat b(T+1) = 2M_T-M_T^{(2)}+\hat b
    b^=2N1(MT(2)MT)\hat b = {2\over N-1}(M_T^{(2)}-M_T)
  • k-단계 이후 예측
    f^T,k=c^+b^(T+k)=2MTMT(2)+kb^\hat f_{T,k} = \hat c+\hat b(T+k) = 2M_T-M_T^{(2)}+k\hat b

단순 지수평활법

  • 시계열 데이터 {X1,X2...}\{X_1,X_2...\}가 수평적 패턴인 경우 사용
  • 시점 t 에서의 단순 지수 평활치
    St=Σk=1tα(1α)tkXkS_t = \Sigma_{k=1}^t\alpha (1-\alpha)^{t-k}X_k
    Σk=1tα(1α)tk1\Sigma_{k=1}^t\alpha (1-\alpha)^{t-k} \approx 1
  • 시점 t+1 에서의 단순 지수 평활치
    St+1=(1α)St+αXt+1S_{t+1} = (1-\alpha)S_t+\alpha X_{t+1}
  • 시점 T에서 시점 T+1의 값 예측
    fT,1=STf_{T,1}=S_T
  • α[0,1]\alpha \in [0,1]이 작을 수록 평활효과가 커짐

이중 지수평활법

  • 시계열 데이터 {X1,X2...}\{X_1,X_2...\}가 추세 패턴을 경우 사용
    Xt=c+bt+atX_t=c+bt+a_t
  • 단순 지수평활치는 추세를 늦게 따라감
    E[St]=E[Σk=1tα(1α)tk(c+bk+ak)]=c+bΣk=1tkα(1α)tkE[S_t]=E[\Sigma_{k=1}^t\alpha (1-\alpha)^{t-k}(c+bk+a_k)]=c+b\Sigma_{k=1}^tk\alpha (1-\alpha)^{t-k}
    =c+bΣl=0t(1(1α)tl)=c+bt1ααb=c+b\Sigma_{l=0}^t(1- (1-\alpha)^{t-l})=c+bt-{{1-\alpha}\over \alpha}b
  • 이중 지수평활치 : St(2)=Σk=1tα(1α)tkSkS_t^{(2)} = \Sigma_{k=1}^t\alpha (1-\alpha)^{t-k}S_k
    E[St(2)]=E[St]1ααbE[S_t^{(2)}]= E[S_t]-{{1-\alpha}\over \alpha}b
  • 시점 T에서 시점 T+1의 값 예측
    fT,1=E[XT+1XT,XT1...]=c+b(T+1)f_{T,1}=E[X_{T+1}|X_T,X_{T-1}...] = c+b(T+1)
    f^T,1=c^+b^(T+1)=2STST(2)+b^\hat f_{T,1} = \hat c+\hat b(T+1) = 2S_T-S_T^{(2)}+\hat b
    b^=α1α(STST(2))\hat b = {\alpha\over 1- \alpha}(S_T-S_T^{(2)})
  • k-단계 이후 예측
    f^T,k=c^+b^(T+k)=2STST(2)+kb^\hat f_{T,k} = \hat c+\hat b(T+k) = 2S_T-S_T^{(2)}+k\hat b

홀트 모형

  • 시계열 데이터 {X1,X2...}\{X_1,X_2...\}가 추세 패턴을 경우 사용
  • 수평 수준과 추세를 각각 갱신하는 모형
    - 수평수준 : Lt=αXt+(1α)(Lt1+bt1),(α(0,1))L_t = \alpha X_t +(1-\alpha)(L_{t-1}+b_{t-1}), (\alpha \in (0,1))
    - 추세 : bt=β(LtLt1)+(1β)bt1,(β(0,1))b_t = \beta (L_t-L_{t-1})+(1- \beta)b_{t-1}, (\beta \in (0,1))
  • T 시점에서 T+k의 값 예측
    fT,k=LT+kbTf_{T,k}=L_T+kb_T

윈터스 모형

  • 홀트 모형에 계절성을 추가반영하여 확장시킴
  • 수평수준, 추세, 계절성을 각각 갱신하는 모형
    - 수평수준 : Lt=αXtstm+(1α)(Lt1+bt1),(α(0,1))L_t = {\alpha X_t \over s_{t-m}} +(1-\alpha)(L_{t-1}+b_{t-1}), (\alpha \in (0,1))
    - 추세 : bt=β(LtLt1)+(1β)bt1,(β(0,1))b_t = \beta (L_t-L_{t-1})+(1- \beta)b_{t-1}, (\beta \in (0,1))
    - 계절성 : st=λXtLt+(1λ)stm,(λ(0,1))s_t = \lambda {X_t \over L_t}+(1- \lambda)s_{t-m}, (\lambda \in (0,1))
    초기치들이 필요하며, 계절성지수는 평균이 1이 되도록 조정 필요
  • 시점 T에서 시점 T+k의 값 예측
    fT,k=(LT+kbT)sTm+kf_{T,k}=(L_T+kb_T)s_{T-m+k}

분해법

  • 분해법에 의한 예측 절차
    1) 중심 이동평균으로 평활치 산출
    CMtCM_t : t번째 값이 중심에 오도록 하여 계절성 m 만큼의 값의 평균
    2) 추세제거 시계열 산출
    DXt(T)=XtCMtDX^{(T)}_t = {X_t \over CM_t}
    3) 계절성 지수 산출
    - 계절별 추세제거 시계열 값의 평균으로 계절성 지수 산출
    4) 계절성 제거 시계열 산출
    DXt(S)=XtstDX^{(S)}_t = {X_t \over s_t}
    5) 회귀모형으로 추세 추정
    6) 추세 및 계절성 지수를 결합하여 예측치 산출

0개의 댓글