时间序列分析(一)——基础概念篇

一、时间序列的相关概念

定义:时间序列是按时间顺序排列的一系列观测值,通常以固定间隔(如秒、天、年)记录。而时间序列分析是一种研究按时间顺序排列的数据点的统计方法,发现趋势、季节性波动、周期性和异常等模式,常用于预测未来走势。

一些相关概念

  • 趋势:数据在长期表现出的上升、下降或平稳的倾向(如GDP增长)。

  • 季节性:固定周期内的重复波动(如冰淇淋销量夏季升高),周期固定(如月、季度)。

  • 周期性:非固定周期的波动(如经济周期),通常跨度较长

  • 随机噪声:无法解释的随机波动,通常假设为白噪声。

  • 平稳性:平稳时间序列的统计特性(如均值、方差和自相关结构)不随时间发生变化。通常情况下,很多时间序列数据并非天然平稳,需要通过差分、对数变换等方法使其平稳化,以便采用各种建模方法。严格平稳,整个概率分布不随时间变化;弱平稳,均值和自协方差函数不随时间变化。

常见的时间序列模型:

  • 自回归模型(AR)
    利用序列自身的过去值来解释当前值。例如,AR(1) 模型表示当前值与前一时刻的值之间存在一定的线性关系。

  • 移动平均模型(MA)
    通过过去误差项的线性组合来描述当前值,强调随机冲击的积累效应。

  • 自回归移动平均模型(ARMA)
    结合了AR和MA两种模型的特点,适用于平稳时间序列的建模。

  • 自回归积分移动平均模型(ARIMA)
    对非平稳序列进行差分处理后,再使用ARMA模型建模。ARIMA模型适用于趋势明显的非平稳序列。

  • 季节性ARIMA模型(SARIMA)
    在ARIMA模型的基础上,进一步考虑季节性成分,适用于具有明显季节性波动的序列。

  • 指数平滑方法
    包括简单指数平滑、霍尔特线性趋势法、霍尔特-温特斯季节性模型等,主要用于平滑时间序列和短期预测。

自相关系数与偏自相关系数:

  • 自相关系数:衡量时间序列在不同滞后值之间的总体相关性,包括直接和间接的影响。
  • 偏自相关系数:衡量时间序列在某个特定滞后值与当前值之间的直接相关性,排除了其他滞后值的影响。在自回归过程 AR(p) 中,偏自相关系数在滞后 p 之后会截尾。

时序分析的分类:在时间序列分析领域,根据分析的侧重点和方法,可以大致分为“描述性时序分析”和“统计时序分析”

二、描述性时序分析

目标:通过可视化和基础统计量,直观地揭示时间序列的特征和模式,不涉及模型假设或预测

核心方法:

  •  可视化:绘制时序图(时间趋势)、季节图(季节性)、自相关图(ACF/PACF)等。
  • 统计量:计算均值、方差、移动平均、趋势成分、季节成分等。
  • 分解法:将序列拆分为趋势(Trend)、季节和残差部分(如加法或乘法模型)。
  • 平稳性初探:通过图形或简单统计量(如滚动均值/方差)判断数据是否平稳。

特点

  • 直观易懂,适合数据探索和初步理解。
  • 非参数方法,不依赖数学模型假设。

 三、统计时序分析

目标:基于统计模型对时间序列建模,进行预测、因果推断或假设检验,强调数学严谨性。

核心方法

  • 模型构建:ARIMA(自回归积分滑动平均)、SARIMA(季节性ARIMA)、状态空间模型(如卡尔曼滤波)、GARCH(波动率建模)等。

  • 参数估计:最大似然估计(MLE)、贝叶斯推断等。

  • 假设检验:单位根检验(ADF检验)、白噪声检验(Ljung-Box)等。

  • 预测:生成点预测和置信区间(如ARIMA预测未来销售额)。

特点

  • 依赖模型假设(如平稳性、线性关系)。

  • 可量化不确定性,提供统计推断支持。

 四、描述性时序分析、统计时序分析的主要区别

描述性时序分析 统计时序分析
目标 描述数据特征(趋势、季节、异常) 建模与预测,量化不确定性
方法 可视化、简单统计量、分解法 参数模型、假设检验、概率推断
复杂度 低(非参数) 高(依赖数学模型和假设)
输出 图表、统计摘要 模型参数、预测值、置信区间
应用阶段 数据探索、预处理阶段 建模、预测、因果分析阶段

 # 文章如有错误欢迎大家指正。我们下期见!