본문 바로가기

데이터 과학 스터디/시계열 스터디

시계열 분석 기법과 응용[Postec 전치혁 교수] Week6-1 VAR 모형의 식별 및 추정 이론

*이 포스트는 포스택 전치혁 교수님의 K-mooc 강의, 시계열 분석 기법과 응용을 기반으로 작성되었습니다.

 

지금까지는 하나의 시계열 데이터를 고려한 모형을 다루었다면 이번 장에서는 여러 시계열(다변량 시계열, 벡터 시계열)을 고려하는 모형에 대해 다루어 보려고 한다. 

시계열 $Z_{1t}, Z_{2t}, Z_{3t}$가 서로 독립적이라면 지금까지 해 왔던 것처럼 단일 시계열 모형을 구축하면 되지만, 대부분의 경우 서로 다른 시계열 끼리 상관 관계가 있는 경우가 존재한다. 위의 예시 처럼, 분기별 소비와 소득 그리고 자산은 서로간의 상관관계가 당연히 존재할 수 밖에 없다. 이런 경우 사용하는 모형이 바로 VAR 벡터 자기 회귀 모형이다.

 

*또 다른 예시로, 연준의 금리와 S&P500은 서로 영향을 주는 두 가지 시계열이 될 수 있겠고, 과거시점 금리와 과거시점 S&P500지수는 현시점 S&P500에 영향을 준다.

 

VAR (Vector AutoRegression)모형

가장 간단한 VAR(1)모형은 위에서 설명한 예시처럼 한 시점이전의 두 시계열이 영향을 주는 경우이다. 이러한 $Z_{1t}, Z_{2t}$를 벡터 형식으로 표현한게 $z_t$가 되고 White noise $a_{1t}, a_{2t}$ 역시 벡터형태 $a_t$로, 각 $\phi$ 값의 경우 4개이므로 행렬$\Phi_1$로 나타낼 수 있다. 최종적으로 이러한 $z_t = \Phi_1z_{t-1} + a_t$ 로 표현이 가능하다.

 

오차항 $a_t$의 경우 각각 서로 다른 분포를 따르므로, 위의 수식처럼 Covariance Vector 형식으로 표현된다. 

 

일반화된 VAR 모형

이를 확장하면 아래와 같이, m차원 시계열의 VAR(1) 나아가 VAR(p)모형으로 일반화가 가능하다. 

한가지 눈여겨봐야 할 점은 VAR(p)모형을 아래 그림 가장 아래와 같이 VAR(1)형태의 표현방법을 사용하는데, 이 편이 성질을 찾기에 더 용이하다는 것이다.

VAR모형의 정상성 조건

VAR 모형 역시 정상성 조건이 필요한데, VAR(1)의 경우 계수행렬인 $Phi_1$ 의 고유치(Eigen Value)들의 크기가 모두 1보다 작아야 한다. VAR(p)역시 VAR(1)의 형태로 표현하였을 때, 계수행렬 F의 고유치들의 크기가 모두 1보다 작아야 한다. 

예시를 통해 살펴보자. 아래는 VAR(2) 모형이다.

VAR(2)모형을 VAR(1)의 형식으로 변환하면, F는 위와 같은 형태가 되고, Eigen Value값을 구하면 4개가 구해지는데, 모두 절댓값의 크기가 1보다 작다. -> 정상적이다.

VAR 모형의 p (시차) 결정

VAR 모형의 p를 결정하는 것은 ACF/PACF를 이용해 구하는 것은 쉽지 않다.

ARCH처럼 여러 모형을 다 시도해보고 정보기준을 이용해 가장 최소인 시차를 선택하는 방법이 가장 많이 사용된다.

다른 방법으로 우도비 검정 또한 존재한다.

아래 예시는 방법2를 이용해 p를 구한다. 표를 보면 lag 즉 p가 0일 때 ~ 5일 때까지를 비교하고 정보기준이 적은 것으로 선택하는 과정을 나타낸다. 이 경우 시차 2가 대부분에서 최적이므로 p=2를 선택한다.