본문 바로가기

데이터 과학 스터디/시계열 스터디

시계열 분석 기법과 응용[Postec 전치혁 교수] Week3-3 최소평균오차 기반의 ARMA 모형 예측치 유도 *이 포스트는 포스택 전치혁 교수님의 K-mooc 강의, 시계열 분석 기법과 응용을 기반으로 작성되었습니다. 시계열 예측 - 시계열 분석의 중요한 목적 중 하나 - 모형을 식별하고, 모수를 추정한 뒤에는 미래값을 예측한다. 최소 평균제곱오차 예측치(Minimum mean squared error prediction)는 가장 기본적인 예측치 중의 하나로, 모델의 예측 성능을 평가하는 기준(Criteria)으로 Mean Squared Error 즉 MSE를 사용하는 방법이다. *MSE는 예측값-실제값의 제곱의 평균을 의미. $f_{n,k}$ 즉 예측값을 과거 데이터의 선형결합인 AR형태로 생각할 수 있고, 여기에 과거 데이터 $Z_n$에 MA 표현(백색잡음)을 대입하게 되면 아래와 같은 식이 나오며, 이를 .. 더보기
시계열 분석 기법과 응용[Postec 전치혁 교수] Week3-2 ARMA모형의 파라미터 추정을 위한 최우추정법 *이 포스트는 포스택 전치혁 교수님의 K-mooc 강의, 시계열 분석 기법과 응용을 기반으로 작성되었습니다. Week 3-2에서는 단계 4 에서부터의 내용을 다룬다. 시계열 모형 추정방법 최소차승법 (least squares method): AR모형의 경우에만 사용 가능하고 일반적으로는 불가. 비선형 최소차승법 (nonlinear least squares method): ARMA 모형에 적용 가능하나 주로 최우추정법을 사용한다. 최우추정법 (maximum likelihood estimation) 최우추정법 IDEA: 오차항이 서로 독립인 정규분포를 따르므로 우도함수 (likelihood function)를 유도해 이를 최대로하는 모형 계수들을 추정한다. 하지만 ARMA 모델의 경우 정확한 우도함수 도출이.. 더보기
시계열 분석 기법과 응용[Postec 전치혁 교수] Week3-1 ARMA모형의 식별: 시차판정 *이 포스트는 포스택 전치혁 교수님의 K-mooc 강의, 시계열 분석 기법과 응용을 기반으로 작성되었습니다. 모형의 식별, 추정 및 검증과정 크게 5가지 단계로 구성된다. 단계 1의 경우는 현재 과정과 다른 내용이라 이번 강의에서 다루지 않았다. 단계 2: 표본 ACF와 PACF 산출 지금까지는 표본이 아니라 이론적인 ACF, PACF에 대해 알아보았다. 실제 데이터에 적용하기 위해서는 아래와 같이 실제데이터를 바탕으로 ACF와 PACF를 산출해야 한다. 단계 3: 이론적 ACF, PACF를 바탕으로 표본 ACF, PACF와 비교해 ARMA 차수를 구한다. 단계 1~3을 두 가지 예시를 통해 직접 따라가 보자 Example 1) 단계 1: 정상성 확인 -> 평균이 크게 변동하지 않고 유지되고 있으며 계절.. 더보기
시계열 분석 기법과 응용[Postec 전치혁 교수] Week2-4 ARMA모형 *이 포스트는 포스택 전치혁 교수님의 K-mooc 강의, 시계열 분석 기법과 응용을 기반으로 작성되었습니다. ARMA 모형 두 모형 AR, MA의 복합 형태이므로, 정상성 조건과 가역성 조건이 동시에 필요하다. ARMA(1,1)모형의 ACF, PACF ACF의 경우 $\rho (1)$만 구하면 $\phi $를 계속 곱해주는 형태여서 지수적으로 감소하는 패턴이다. PACF 역시 복잡하지만 계산시 지수적으로 감소하는 패턴을 띈다. ARMA(p,q)모형의 ACF, PACF 이번에는 일반화된 ARMA(p,q) 모형을 확인해보자. 아래의 성질은 ARMA 모델을 구상할 때, ACF와 PACF를 바탕으로 가장 적절한 $p$와 $q$를 선택하는 데에 도움을 준다. *0으로 떨어진다는 의미는 지수적으로 감소한다는 의미를.. 더보기
시계열 분석 기법과 응용[Postec 전치혁 교수] Week2-3 AR모형 및 MA모형의 표현 및 성질 규명 *이 포스트는 포스택 전치혁 교수님의 K-mooc 강의, 시계열 분석 기법과 응용을 기반으로 작성되었습니다. ARMA ARMA 모형 - AR 과 MA 표현 방식이 결합된 형태 - ARMA(1,1): 시차 1의 변수와 시차 1의 백색잡음 포함 - week2-3에서는 다루지 않는다. AR 모형 - AR 표현방식이며 유한 시차로 구성 - AR(1): 시차 1 변수 포함, 가장 단순한 형태 AR(2) 모형부터 정상성 조건이 복잡해진다. (유도과정도 어렵다고 한다.) AR(1) 모형의 ACF와 PACF를 살펴보자. *ACF를 구하는 증명은 이전 포스팅 Week 2-1에서 다룬바 있다. https://uky-note.tistory.com/29 시계열 분석 기법과 응용[Postec 전치혁 교수] Week2-1 정상적.. 더보기
시계열 분석 기법과 응용[Postec 전치혁 교수] Week2-2 편자기상관함수, AR/MA 표현방식, 후향연산자 *이 포스트는 포스택 전치혁 교수님의 K-mooc 강의, 시계열 분석 기법과 응용을 기반으로 작성되었습니다. 편자기상관함수 (Partial Autocorrelation function, PACF) - 정상적 시계열의 형태를 식별하는데 ACF 외에 PACF의 정보를 활용함. - 내가 고려하고자 하는 시점 $t, t-k$ 사이의 중간 시점들 $(t-1, t-2, ... t-k+1)$에 대한 정보가 주어진 상태의 Correlation. - 따라서 중간값이 없는 $P(1)$의 경우 조건부 확률이 제외되므로, ACF와 동일한 값을 가지게 된다. - 아래 회귀식을 살펴보면 $Z_t$를 설명하기 위해 이전 정보들 $Z_{t-1} ~ Z_{t-k}$의 선형결합을 진행 했을 때, $t-k$의 계수와 동일하다고 볼 수 있.. 더보기
시계열 분석 기법과 응용[Postec 전치혁 교수] Week2-1 정상적 시계열과 자기상관함수 *이 포스트는 포스택 전치혁 교수님의 K-mooc 강의, 시계열 분석 기법과 응용을 기반으로 작성되었습니다. 정상적 시계열 (Stationary Time Series) - 실제 시계열은 추세, 계절성을 포함하는 비정상적(non-stationary)인 것이 많다. - 비정상적 시계열은 적절한 변환을 통해 정상적 시계열로 바꿀 수 있다. 강 정상성 (Strong Stationarity) *여기서 결합확률분포(Joint Distribution)란 $X$와 $Y$ 두 개의 변수가 있을 때 그 순서쌍 $(X_i, Y_i)$ 가 동시에 특정한 값을 갖는 확률 $P(X=X_i, Y=Y_i)$을 의미하며, 이를 함수로 나타내면 $f(X,Y)$ 즉 joint probability mass function이 된다. 즉 강.. 더보기
시계열 분석 기법과 응용[Postec 전치혁 교수] Week1-3 홀트-윈터스와 분해법 *이 포스트는 포스택 전치혁 교수님의 K-mooc 강의, 시계열 분석 기법과 응용을 기반으로 작성되었습니다. 추세와 계절성이 있는 시계열에 적용 윈터스 (Winters) 모형 홀트 모형에 계절성 (seasonality)을 추가반영하여 확장시킴 가법 (additive) 모형과 승법 (multiplicative) 모형이 있음 - 강의에서는 승법만 설명 -$s_t$ : 기존 홀트 방법에서는 추세 $bt$ 변수 까지만 존재하였음. Winters에는 계절성 지수 $s_t$가 추가됨. $t=1, \ldots ,m$ -$m$ : 계절성 공식의 $m$은 계절의 주기를 나타내는 것으로, 분기별 데이터의 경우 $m=4$, 월별이면 12, 주별이면 7 $\alpha, \beta, \gamma$의 최적값을 찾는 소프트웨어도 .. 더보기