Prophet: forecasting at scale

Prophet: forecasting at scale

예측 Forecast는

1> Capacity Planning –  효율적인 자원할당

2> Goal Setting – Baseline과 관련있는 성과 측정

3> 결측치(anomaly detection)를 제거

위 3가지의 선결 조건이 있다.

대부분의 예측은 그 상황에 대한 경험에 의존적일 수 밖에 없으며, 그렇기에 우리는 그런 상황에 대한 가정을 통해 문제를 풀어간다.

예측은 주로 시간의 흐름에 따라 순서대로 관측되는 경제 통계학적 분석에 아래와 같이 많이 사용된다.

경제 통계학적으로 변동성을 구분해 보면 하기 4가지로 표현할 수 있다

1> Trend Analysis (추세 분석)에 필요한 추세 변동은 인구,기술,생산성,물가에 따른 장기적 변동성을 본다 (통상 10년 이상의 주기)

추세를 바탕으로 하는 경제 지표를 통하여 잠재생산 수준 (HP(Hodrick-Prescott) 필터와 같은 비이론적 방법)

시계열에서 추세변동은 확정적 추세변동(시간에 따라 선형 또는 비선형으로 측정)과 확률적 추세변동(확률적 충격이 누적되어 나타나는 추세변동)으로 나뉠 수 있다. 이처럼 확률적 추세를 가지는 경제통계는 주로 단위근을 가지는 불안정한 시계열로 표현된다.

2> Seasonality(계절 변동) : 1년 주기로 반복 또는 변동되는 것 요일과 명절까지 포함 – 경제 분석 시 제거해야 할 변동성 지표

3> 순환 변동(Cycle) : 경기 순환에 따라 반복되는 변동 (2~5년 주기) – 경제 정책과 밀접한 관련이 있으며 경제 분석 시 가장 관심을 가지는 변동 한국의 경우는 국가 주도의 경제 정책들로 말미암아 순환 변동성이 확대되는 사례들이 많이 있음

4> 불규칙 변동(Irregularity) : 파업, 자연재해 등 돌발요인이나 원인불명의 요인 – 경제 분석 시 제거해야 할 변동성 지표

위의 경제통계학적 변동성 중에 1> 추세  변동성을 통해 우리는 잠재 GDP의 Factor들 자연실업률과 물가를 추정할 수 있다.

이느 바로 거시 경제의 지표를 예측할 수 있는 값들이다.

이는 바로 경제의 순환주기를 통해 예측될 수 있는 부분이고,

경제의 순환주기란 즉 경기상승 및 하락국면으로 표시되는 일종의 파동을 의미하고, 순환변동은 전기대비 성장률, 전년동기대비 성장률로 표현된다

주기를 예측할 때 사용되는 데이터들에 대한 전처리가 무엇보다 중요하다. 그 이유는 대부분의 표본값들을 모델링 할 수 있는 Data Transform이 무엇보다 중요하기 때분이다.

그렇기에 예측에서 중요한 것은 바로 Forecast Evaluation을 통하여 Surface Problem을 도출하고 이를 제거하고 다시 모델링하는 아래와 같은 순환 메커니즘의 활용이다.

https://github.com/tylee33/DLforFinance/blob/master/FDAnalysis/BitCoin%20Price%20Predict.ipynb

Leave a Reply

Your email address will not be published. Required fields are marked *