*이 포스트는 포스택 전치혁 교수님의 K-mooc 강의, 시계열 분석 기법과 응용을 기반으로 작성되었습니다.
시계열 예측
- 시계열 분석의 중요한 목적 중 하나
- 모형을 식별하고, 모수를 추정한 뒤에는 미래값을 예측한다.
최소 평균제곱오차 예측치(Minimum mean squared error prediction)는 가장 기본적인 예측치 중의 하나로, 모델의 예측 성능을 평가하는 기준(Criteria)으로 Mean Squared Error 즉 MSE를 사용하는 방법이다.
*MSE는 예측값-실제값의 제곱의 평균을 의미.
$f_{n,k}$ 즉 예측값을 과거 데이터의 선형결합인 AR형태로 생각할 수 있고, 여기에 과거 데이터 $Z_n$에 MA 표현(백색잡음)을 대입하게 되면 아래와 같은 식이 나오며, 이를 다시 MSE 형태로 변환하면 위 그림의 Q가 된다.
MSE를 기준으로, 가장 Q값을 minimize 시키는 $c$의 추정치를 구하면 아래와 같이 $\psi$로 추정될 수 있으며, 최종 모델의 예측값은 $\psi$와 $a_n$들의 곱으로 표현될 수 있다. 이를 다시 Z값 기준으로 보면 이전 시점 $Z_n$~$Z_1$이 주어졌을 때, $Z_{n+k}$의 기대치 즉 조건부 기대치가 된다.
실제값과, 예측치의 차이, 즉 예측오차에 분산을 씌우면, $Z_n$, $Z_{n-1}$ ... $Z_1$이 주어졌을 때, $Z_{n+k}$의 분산 즉 조건부 분산이 된다. 이러한 예측오차 분산은 예측치가 실제값에 비해 얼마나 차이가 나는지를 표현한다.
따라서 예측식은 조건부 기대치로 구할 수 있고, 예측오차의 분산은 한단계의 경우 무조건 $\sigma _a ^{2} $, k단계의 경우 조건부 분산으로 구할 수 있다.
이를 AR 모형들에 적용해 보자.
AR(2)에서 첫 번째 예측식의 경우 $Z_t = \phi_1Z_{t-1} + \phi_2Z_{t-2} + a_t$ 형태의 AR(2)모형 식의 t값에 n+1을 대입하고 양변에 Expectation을 씌워주게 되면 $E[Z_{n+1}] = E[\phi_1Z_{n} + \phi_2Z_{n-1} + a_{n+1}]$이 되고 $a_{n+1}$의 평균은 미래의 백색잡음이므로 0이되어 쉽게 한 단계 예측식을 구할 수 있다. 2단계와 AR(4)의 예측식도 동일하게 구할 수 있으며, 분산또한 같은 방법 (n+1 대입 후 양변에 Var 씌워주기)으로 구할 수 있다.
즉 4단계에서 추정된 $\phi_1$과 과거 데이터 $Z_n$만 있으면 쉽게 예측치와 분산을 구할 수 있다.
이번엔 MA모형들에 적용해보자.
MA모델의 경우 백색잡음의 선형결합으로 이루어져있음. AR과 같은 방식으로 t 대신 n+1을 집어넣게 되면,
$Z_{n+1} = a_{n+1} - \theta_1 x a_n - \theta_2 x a_{n-1}$이 된다. 여기에 Expectation을 양변에 씌우면
a_{n+1}의 경우 미래의 백색잡음이므로 기대치가 0이되지만, 과거의 경우 이미 주어진 상수이기 때문에 그대로 남아서 아래 한단계 예측식의 형태가 남게된다. (여기서 $\theta_1, \theta_2$는 단계 4 에서 구한 추정치)
나머지 예측식과 분산도 동일한 방법으로 구할 수 있다.
'데이터 과학 스터디 > 시계열 스터디' 카테고리의 다른 글
시계열 분석 기법과 응용[Postec 전치혁 교수] Week4-2 계절성을 반영한 ARIMA 모형 이해 (0) | 2023.03.22 |
---|---|
시계열 분석 기법과 응용[Postec 전치혁 교수] Week4-1 비정상적 시계열 모형화를 위한 ARIMA 모형 (0) | 2023.03.22 |
시계열 분석 기법과 응용[Postec 전치혁 교수] Week3-2 ARMA모형의 파라미터 추정을 위한 최우추정법 (0) | 2023.03.15 |
시계열 분석 기법과 응용[Postec 전치혁 교수] Week3-1 ARMA모형의 식별: 시차판정 (0) | 2023.03.15 |
시계열 분석 기법과 응용[Postec 전치혁 교수] Week2-4 ARMA모형 (0) | 2023.03.15 |