ARIMA & SARIMA & SARIMAX

장재성·2021년 9월 27일
0

ARIMA(Auto-Regressive integrated Moving Average)

ARIMA를 이용한 시계열 데이터 분석 과정

  1. 데이터 불러오기
  2. 계절성(seasonality)과 정상성(stationarity)이 있는지 그래프를 통해 확인
  3. 계절성과 정상성이 있는 경우 차분(differencing)과 로그변환(transformation)을 통해 계절성을 제거하여 정상적인 시계열 데이터로 만든다.
  4. ARIMA 모형의 모수(parameter)를 결정하고 학습(fit)시킨 뒤 모형의 적절성을 점검한다. parameter는 ACF, PACF등의 방식으로 결정한다.

시계열 데이터 분석을 위해서는 데이터가 weak stationarity(약 정상성)을 가져야 한다.

Weak stationarity 만족 조건

  1. 시간(t)이 흘러도 평균이 같다.
  2. 시간이 흘러도 분산이 같다.
  3. 자기공분산 또는 자기상관관계(auto_correlation)이 시간이 아닌 시차에 의존한다.
    = t시점과 t+s시점의 공분산이 같고, t시점과 t-s시점의 공분산이 같다는 의미
    ex) 3월 1일과 3월 2일(시차1)의 공분산과, 3월 2일과 3월 3일(시차1)의 공분산이 0.5이고 3월 1일과 3월 3일(시차2)의 공분산과 3월 2일과 3월 4일(시차2)의 공분산이 0.3이라면, 3월 10일과 3월 11일(시차1)의 공분산은 0.5일 것으로 예측가능하다.

SARIMA(Seasonal ARIMA)

  • ARIMA + seasonal(AR, I, MA)의 형태
  • 즉 기존의 ARIMA에 seasonal 주기를 기준으로 하는 ARIMA를 더한 형태이다
  • 이중 ARIMA라고 생각하면 된다.
  • SARIMA는 AIC를 기준으로 모델 적합성을 확인한다.
  • AIC 값이 낮을 수록 모델에 적합하다고 볼 수 있다.

SARIMAX(SARIMA + eXogenous)

  • SARIMA + 외부변수(날씨 등등)
profile
초심자

0개의 댓글