在选择正确的模型之前,首先应确定变量的关系和影响!!!区分清楚到底什么选择情况下选择回归预测,什么情况下选择时间序列预测。
回归预测:训练得到的回归模型表示了因变量 (目标)与自变量 ()(预测因子)之间的相关性,即一个或多个自变量对一个因变量的影响程度,适用于给定新的 来预测 的情况。
常用回归模型(因变量 是连续值):
线性回归(Linear Regression)
非线性——多项式回归(Polynomial Regression)
正则化——岭回归(Ridge Tegression)、拉索回归(Lasso Regression)、弹性网络回归(ElasticNet Regression)
在数据集中的变量之间具有高维度和多重共线性的情况下效果较好。
神经网络(Neural Networks)等。
注意:在开始模型训练之前需要对数据进行归一化!!!
逻辑回归(Logistic Regression)虽然叫回归,但实际是用于“分类”的,预测的是 为1或0的概率。
时间序列预测:训练得到的模型表示了随时间变化的 之间的相互依赖性与相关性,适用于预测未来一段时间内 的变化情况。
常用时间序列模型:AR模型、MA模型、ARMA模型
Holt-Winter模型(一次指数模型:预测为恒定值;
二次指数模型 :预测趋势值;
三次指数模型:预测趋势和季节性 )
LSTM模型(适用于周期性)等。