集成学习算法策略 Boosting和Bagging - 代码天地

集成学习算法策略 Boosting和Bagging

其他 2018-07-31 18:16:32 阅读次数: 0

集成学习是机器学习中的一个重要分支。

它主要包含两种策略：Boosting和Bagging。

Boosting和Bagging都是基于多个弱学习器(弱分类器)(例如：一颗欠拟合的决策树)的基础之上的，且要满足，每一个弱学习器的分类准确性都要强于随机分类(即准确率大于50%)

策略	Boosting方法	Bagging方法
训练方式	主要通过改变训练样本的权重(初始化时给所有训练样本相同的权重)，学习多个弱学习器，并将这些弱学习器进行线性组合，提高分类性能。	主要通过从原始训练集中抽取n个样本的训练集，共进行k次，得到K个样本集，每个样本集单独训练，最后如果是分类方法则通过投票的方式得到分类结果；如果是回归方法则采用平均值的作为预测结果。
样本选择	每一轮的训练集不变，只是训练集中每个样例在弱学习器中的权重发生变化。而权值是根据上一轮的分类结果进行调整。	训练集是在原始训练数据集中有放回选取的，从原始训练数据集中选出的各轮训练集之间是独立的。
样例权重	根据错误率不断调整样例的权值，样例被错误分类的概率越大则样例权重越大。	使用均匀取样，每个样例的权重相等。
预测函数	每个弱学习器都有相应的权重，对于分类误差小的弱学习器会有更大的权重。	所有预测函数的权重相等。
并行计算	各个预测函数只能顺序生成，因为后一个模型参数需要前一轮模型的结果。	各个预测函数可以并行生成。

这两种方法都是把若干个弱学习器整合为一个综合学习器的方法，只是整合的方式不一样，最终得到不一样的效果，将不同的分类算法套入到此类算法框架中一定程度上会提高了原单一弱学习器的分类效果，但是也增大了计算量。

集成学习算法的常见应用：

Bagging + 决策树 = 随机森林(Random Forest)
AdaBoost + 决策树 = 提升树
Gradient Boosting + 决策树 = GBDT

猜你喜欢

转载自blog.csdn.net/baishuiniyaonulia/article/details/81020554

集成学习算法策略 Boosting和Bagging

集成学习boosting和bagging

集成学习算法总结----Boosting和Bagging

集成学习Bagging和Boosting算法总结

集成算法之Bagging和Boosting

集成学习之Bagging和Boosting的简介

集成学习-Boosting和Bagging异同

集成学习:Bagging和Boosting比较

集成学习方法Boosting和Bagging

集成学习之bagging和boosting

集成学习中的Boosting和Bagging

集成学习（Ensemble Learning）（Boosting、Bagging和结合策略）

机器学习：Bagging和Boosting算法比较

深度学习：Bagging 和 Boosting算法

机器学习中Bagging和Boosting的区别

机器学习之boosting和bagging

集成学习：Boosting与Bagging

集成学习—Boosting、Bagging

通俗理解集成学习boosting和bagging和随机森林

数据挖掘算法---bagging和boosting集成的区别

【IM】关于集成学习Bagging和Boosting的理解

集成学习法之bagging方法和boosting方法

集成学习-bagging，boosting介绍

数据挖掘算法和实践（十八）：集成学习算法（Boosting、Bagging）

[DataAnalysis]机器学习中集成学习Boosting、Boostrap和Bagging算法介绍

机器学习——Bagging和Boosting的区别（面试准备）

机器学习进阶之（五）Bagging和Boosting

【机器学习】Bagging和Boosting的区别（面试准备）

机器学习问题：bagging和boosting方法的区别与联系

bagging集成与boosting集成的区别

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)