1. 정상성

– 평균이 일정하다. 즉 모든 시점에 대해 일정한 평균을 가진다.

– 분산도 시점에 의존하지 않는다

– 공분산은 단지 시차에만 의존하고 실제 어느 시점 t,s 에는 의존하지 않는다.

대부분의 경우 실제의 데이터는 이러한 정상성을 만족하지 않는다.

그래서 정상성을 만족하지 않는 데이터를 정상 시계열 데이터로 변환해야 하는데

이때, 변환, 차분과 같은 방법을 사용할 수 있다.

일반적으로 평균이 일정하지 않는 경우에는 차분을 이용하고, 분산이 일정하지 않은 경우에는

변환을 이용하여 정상 시계열 데이터로 변환한다.

차분의 경우 바로 전 시점의 데이터를 빼는 것을 일반차분, 계절성을 갖는 데이터의 경우 여러 시점전의

데이터를 빼는 계절차분을 사용한다.

2. 시계열 모형

– 자기 회귀 모형 (AR)

: P 시점전의 자료가 현재 자료에 영향을 주는 모형

Z(현재 시점) = Z (현재-(P+1)) * (영향도 계수) + Z (현재-(P+2)) * (영향도 계수) + …. + 백색잡음

–> AR(1) : Z = @Z(t-1)

AR(2) : Z= @Z(t-1) + @Z(t-2)

– 이동평균 모형 (MA)

: 유한한 개수의 백색잡음의 결합으로 언제나 정상성을 만족한다

그전 시간의 변수가 아니라 백색잡음만 가지고 식을 만든다…

(백색 잡음이란 시계열 분석에서의 오차항을 의미함 )

–> MA(1) : Z = a(핸재잡음) – a(t-1)(현재시간 -1 잡읍)

MA(2) : Z = a(핸재잡음) – a(t-1)(현재시간 -1 잡읍) – a(t-2)(현재시간 -2 잡읍)

– 자기회귀누적이동평균모형 (ARIMA)

: 비정상 시계열 모델 ARIMA 를 정상 시계열 ARMA 로 만들어야 하는데 …

차분 몇번 변환 몇번을 하였는가에 따라 ARIMA(p, d, q) 가 달라진다..

ARIMA(p , d, q)

-> p : AR , q : MA, d : 차분 횟수

d(차분횟수)가 0 이면 ARMA(p,q) 이되고 정상성을 만족함

p(AR) 0이면 IMA(d,q) 모형으 따르고 d 번 차분하면 MA(q) 로 정상성을 만족

나머지 케이스도 동일 ~

3. 분해 시계열

– 시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석하는 방법을 말하면 회귀적인 방법을 주로사용

1) 추세요인

: 데이터 오르거나 내리거나 2차식 형태를 취하거나 하는 형태가 있을 경우~ 추세가 있다고 한다.

2) 계절요인

: 고정주기에 자료가 변화할 경우 (계절처럼 고정 주기가 있는 경우) 계절용인이 있다고 한다.

3) 순환요인

: 명백한 경제적이거나 자연적인 이유 없이 알려지지 않은 주기를 가지고 변화하는 자료 (여튼 주기가 있다!)

4) 불규칙요인

: 위의 세가지 요인으로 설명할수 없는 오차에 해당하는 데이터를 불규칙 요인이라고 한다.

※ 이제 코드를 좀 봐야 할 시간
install.packages(“xts”)
install.packages(“TTR”)
install.packages(“forecast”)
install.packages(“zoo”)
install.packages(“timeDate”)
install.packages(“colorspace”)
install.packages(“fracdiff”)
install.packages(“tseries”)
install.packages(“Rcpp”)
library(TTR)
library(forecast)