【一】时间序列预处理
- 指的是序列的 平稳性检验 和 纯随机性检验
- 每个统计学问题都需要进行一定的 假设,同样时间序列预测也是
- 一条时间序列里长期 稳定不变 的规律,是基本模型
- 平稳的基本思想:时间序列的行为并不随时间改变
- 平稳性检验
- 【不常见】严平稳:这是一种比较严格的定义,认为只有当序列所有的统计性质都不会随着时间的推移而发生变化时,该序列才能平稳。而在实践中要获得严平稳序列很难,通常只具有理论意义
- 【最常见】宽平稳:使用 序列的特征统计量 来定义,认为序列的统计性质主要由它的 低阶矩 决定,因而只要保证 低阶矩(二阶) 平稳,就能保证序列近似稳定
- 通俗的讲,一些统计特征随着时间保持不变,可以认为它是稳定的,如 平均值,方差,自斜方差 等
【二】时间序列预测方法
- 移动平均法
-
一次 移动平均法:每次取一定数量周期的数据平均,按时间顺序逐次推进。每推进一个周期时,舍去前一个周期的数据,增加一个新周期的数据
-
二次 移动平均法:当预测变量的基本趋势发生变化时,如有一个线性增长的过程,即线性趋势,一次移动平均法的滞后偏差使预测值偏低,不能进行合理的趋势外推。因此,需要引入线性方程 Xt = a + bt 来适应这种变化
线性模型预测公式:
运用移动平均值来确定平滑系数,有:
二次移动平均法不仅能处理预测变量的模式呈水平趋势时的情形,同时又可应用到长期趋势(线性)
-
两点不足:
(1)每计算一次移动平均值,需要存储最近N个观察数据,当需要经常预测时有很多不便之处
(2)移动平均实际上是对最近的N个观察值等权看待,而对 t-N 期以前的数据则完全不考虑
- 指数平滑法:现实生活中,更为确切的方法是对各期观察值依时间顺序加权。因此,指数平滑法应运而生
- 一次 指数平滑法
设时间序列有:
预测公式为:
一次指数平滑值为:(可以看出,离现在时刻越远的数据,其权重系数越小)
- 二次 指数平滑法:同样,与移动平均法类似,当预测变量趋势发生变化时,比如呈线性增长,一次指数平滑法将不再适用,需要引入二次指数平滑法
一次指数平滑值:
二次指数平滑值
二次指数平滑法的预测模型为直线趋势模型
-
ARIMA
-
RNN
-
LSTM - RNN 变种
【三】时间序列预测流程
- 以 ARIMA 模型为例
【四】时间序列预测工具
- ProPhet - FaceBook
- Forecasting Model
函数表示
- Trend
- Seasonality Effects(季节性影响)
- Holiday and Events Effects
- PyFlux
ARIMA Model
GARCH Model
GAS Model
Gaussian State Space Model