随机森林和Adaboost区别

不同点:

Adaboost是基于Boosting的算法,个体学习器之间存在强依赖关系,须串行连接。每一轮的训练集不变,只是训练集中每个样例在分类器中的权重发生变化。而权值是根据上一轮的分类结果进行调整,根据错误率不断调整样例的权值,错误率越大则权重越大。

随机森林是基于Bagging的算法,个体学习器没有强依赖关系,可并行连接。个体学习器的训练集是通过随机采样得到的,训练集是在原始集中有放回选取的,并且选出的各轮训练集之间是独立的。使用均匀取样,每个样例的权重相等。用随机选择的特征,这样使得每个弱学习器相关性减小,使得准确性提高。

相同点:

原理相同,均是集成学习算法,通过生成一组个体学习器,然后通过某种策略将他们集合起来。最终生成一个强学习器。

猜你喜欢

转载自blog.csdn.net/liaoningxinmin/article/details/85009182