시계열 분석 썸네일형 리스트형 시계열 분석 기법과 응용[Postec 전치혁 교수] Week5-1 오차의 조건부 분산 개념 및 ARCH 모형 *이 포스트는 포스택 전치혁 교수님의 K-mooc 강의, 시계열 분석 기법과 응용을 기반으로 작성되었습니다. ARCH 모형 이번 장에서는 ARCH(Autoregressive Conditional heteroskedasticity) 모형에 대해서 다룬다. week 1~4까지는 오차항 $a_t$이 white noise라는 가정을 통해 시계열 모델을 구축했으나, 현실에서는 잔차 역시 완전히 설명되지 않은 경우가 많다. 금융데이터가 대표적으로 잔차의 ACF&PACF는 0의 형태를 띄는 것으로 보이나, 잔차에 절대값이나 제곱을 씌워서 다시 그려보면 위 그림처럼 자기상관관계가 존재하는 경우가 많다고 한다. 또한 연구결과에 따르면 오차항(Residual)의 분산이 시간에 따라 일정하지 않고 변한다는 관측이 존재한다... 더보기 시계열 분석 기법과 응용[Postec 전치혁 교수] Week3-2 ARMA모형의 파라미터 추정을 위한 최우추정법 *이 포스트는 포스택 전치혁 교수님의 K-mooc 강의, 시계열 분석 기법과 응용을 기반으로 작성되었습니다. Week 3-2에서는 단계 4 에서부터의 내용을 다룬다. 시계열 모형 추정방법 최소차승법 (least squares method): AR모형의 경우에만 사용 가능하고 일반적으로는 불가. 비선형 최소차승법 (nonlinear least squares method): ARMA 모형에 적용 가능하나 주로 최우추정법을 사용한다. 최우추정법 (maximum likelihood estimation) 최우추정법 IDEA: 오차항이 서로 독립인 정규분포를 따르므로 우도함수 (likelihood function)를 유도해 이를 최대로하는 모형 계수들을 추정한다. 하지만 ARMA 모델의 경우 정확한 우도함수 도출이.. 더보기 시계열 분석 기법과 응용[Postec 전치혁 교수] Week2-2 편자기상관함수, AR/MA 표현방식, 후향연산자 *이 포스트는 포스택 전치혁 교수님의 K-mooc 강의, 시계열 분석 기법과 응용을 기반으로 작성되었습니다. 편자기상관함수 (Partial Autocorrelation function, PACF) - 정상적 시계열의 형태를 식별하는데 ACF 외에 PACF의 정보를 활용함. - 내가 고려하고자 하는 시점 $t, t-k$ 사이의 중간 시점들 $(t-1, t-2, ... t-k+1)$에 대한 정보가 주어진 상태의 Correlation. - 따라서 중간값이 없는 $P(1)$의 경우 조건부 확률이 제외되므로, ACF와 동일한 값을 가지게 된다. - 아래 회귀식을 살펴보면 $Z_t$를 설명하기 위해 이전 정보들 $Z_{t-1} ~ Z_{t-k}$의 선형결합을 진행 했을 때, $t-k$의 계수와 동일하다고 볼 수 있.. 더보기 시계열 분석 기법과 응용[Postec 전치혁 교수] Week2-1 정상적 시계열과 자기상관함수 *이 포스트는 포스택 전치혁 교수님의 K-mooc 강의, 시계열 분석 기법과 응용을 기반으로 작성되었습니다. 정상적 시계열 (Stationary Time Series) - 실제 시계열은 추세, 계절성을 포함하는 비정상적(non-stationary)인 것이 많다. - 비정상적 시계열은 적절한 변환을 통해 정상적 시계열로 바꿀 수 있다. 강 정상성 (Strong Stationarity) *여기서 결합확률분포(Joint Distribution)란 $X$와 $Y$ 두 개의 변수가 있을 때 그 순서쌍 $(X_i, Y_i)$ 가 동시에 특정한 값을 갖는 확률 $P(X=X_i, Y=Y_i)$을 의미하며, 이를 함수로 나타내면 $f(X,Y)$ 즉 joint probability mass function이 된다. 즉 강.. 더보기 시계열 분석 기법과 응용[Postec 전치혁 교수] Week1-2 지수평활법 *이 포스트는 포스택 전치혁 교수님의 K-mooc 강의, 시계열 분석 기법과 응용을 기반으로 작성되었습니다. 지수평활법(Exponential Smoothing) 평활치를 구하는데 전체 데이터를 사용하며 시간에 따라 다른 가중치를 줌 과거로 갈수록 지수적으로 감소하는 가중치 사용 단순 지수평활(Simple Exponential Smoothing) 시계열 데이터가 수평적 패턴인 경우 사용 $\alpha$ = $[0,1]$, $\alpha$가 클 수록 현재 시점에 더 가중치를 둔다 알파가 작을 수록 변동이 심한 현재 시점보다는 과거의 시점에 더 가중치를 둠으로서 Smoothing 효과가 더 커진다. 최근 데이터와 이전 지수평활의 가중평균 아래 그림을 통해 볼 수 있듯이, $\alpha$가 적을 때가 훨씬 평활.. 더보기 시계열 데이터 전처리 방법(실전 시계열 분석 2장) *이 글은 실전 시계열 분석 책을 기반으로 작성되었습니다. 시계열 데이터의 전처리 Flow 일변량 시계열 vs 다변량 시계열 - 일변량 (univariate) : 시간에 대해 측정된 변수가 하나인 경우 - 다변량 (multivariate) : 시간에 대해 측정된 변수가 여러개인 경우 저자는 시간에 따라 정렬된 데이터셋 (EX: Kaggle과 같은 대회용 데이터셋) 이 아니라, 시계열로 주어지지는 않았으나, Time stamp, "시간" 은 없지만 시간을 대체할 수 있는 데이터 혹은 물리적 흔적이 남은 데이터 셋을 일컬어 발견된 시계열 found time series라고 명칭한다. 2 장에서는 발견된 시계열을 어떻게 전처리 하는지를 예제와 함께 다룬다. 먼저 예제를 통해 큰 흐름을 살펴보자. 발견된 시계열.. 더보기 이전 1 다음