【论文推荐|滑坡检测·空间预测·时间预测· 数据驱动的分析】机器学习在滑坡研究中的最新进展与应用(2022)(二)

【论文推荐|滑坡检测·空间预测·时间预测· 数据驱动的分析】机器学习在滑坡研究中的最新进展与应用(2022)(二)

【论文推荐|滑坡检测·空间预测·时间预测· 数据驱动的分析】机器学习在滑坡研究中的最新进展与应用(2022)(二)



欢迎铁子们点赞、关注、收藏!
祝大家逢考必过!逢投必中!上岸上岸上岸!upupup

大多数高校硕博生毕业要求需要参加学术会议,发表EI或者SCI检索的学术论文会议论文。详细信息可关注VX “学术会议小灵通”或参考学术信息专栏:https://blog.csdn.net/2401_89898861/article/details/145551342


论文地址:https://doi.org/10.1007/s11069-022-05423-7

2.2 预测 vs 解释(Prediction vs Explanation)

统计学界长期争论预测模型与解释性、描述性模型的科学价值(Geisser, 1975; Wallis, 1980; Breiman, 2001; Parzen, 2001; Feelders, 2002; Shmueli, 2010)。ML 技术的兴起加剧了这一讨论,因为其在预测性能上优于传统统计方法。Breiman(2001) 将数据驱动分析划分为两种范式:数据建模(Data Modeling) 和 算法建模(Algorithmic Modeling)。前者基于统计假设,旨在揭示数据内在机理;后者则不假设数据生成机制,仅关注提高预测精度。Shmueli(2010) 进一步指出,数据建模追求“真理”,而算法建模关注“现实”——即基于数据的最优预测。

大多数 ML 方法属于 算法建模,核心目标是优化预测,而非解释数据规律。因此,我们将 ML 在滑坡研究中的应用界定为:

  • 以高精度预测为主要目标,排除基于线性统计推断的解释性模型。
  • 采用训练-测试数据划分策略,并通过测试集评估模型性能,以验证泛化能力。

2.3 传统机器学习 vs 深度学习(Conventional ML vs Deep Learning)

深度学习(DL)是机器学习(ML)的子集,其核心区别在于数据学习方式。DL 主要基于 人工神经网络(ANN),而传统 ML 包括但不限于 ANN。

  • 在 传统 ML 中,数据通常由人工提取的特征表示,算法学习数据模式以进行分类或回归。特征选择至关重要,研究者需依据数据规模及算法需求增减特征,以提高模型性能。
  • 深度学习 采用端到端学习方式,直接输入图像、文本、视频或时序数据,由多层神经网络自动提取特征并建立映射关系,实现分类或决策。由于参数规模庞大,DL 训练通常需要大量数据,以确保模型的泛化能力。

2.4 机器学习方法(Learning Methods)

机器学习(ML)主要包括监督学习、无监督学习(半监督学习可视为二者的混合)和强化学习三大类。

1. 监督学习(Supervised Learning)

监督学习基于输入-输出对(features-labels)进行训练,学习输入特征与目标变量之间的映射关系,直至模型在训练数据上达到预期精度。模型的泛化能力通过测试集评估
典型算法包括:

  • 决策树及其集成方法(如随机森林、梯度提升算法:AdaBoost、XGBoost 等);
  • 支持向量机(SVM);
  • 人工神经网络(ANN),如多层感知机(MLP)和监督式深度学习(DL)模型。

2. 无监督学习(Unsupervised Learning)

无监督学习无目标变量,旨在发现数据的内在结构,典型任务是聚类
常见算法包括:

  • 层次聚类、K-means、基于密度的聚类(DBSCAN);
  • 深度生成模型,如自编码器(Autoencoder)和生成对抗网络(GAN)。

3. 强化学习(Reinforcement Learning, RL)

强化学习通过环境交互优化决策策略,目标是最大化累积奖励(episodic 任务)或长期平均奖励(持续性任务)。智能体(Agent)基于马尔可夫决策过程(MDP),学习最优策略。
典型方法包括:

  • 深度强化学习(Deep Reinforcement Learning, DRL),如 DQN、PPO、A3C。
    在这里插入图片描述下节请参考:【论文推荐|滑坡检测·空间预测·时间预测· 数据驱动的分析】机器学习在滑坡研究中的最新进展与应用(2022)(三)