机器学习（四）：分而治之（上）——决策树分类 - 代码天地

机器学习（四）：分而治之（上）——决策树分类

其他 2020-01-24 12:26:17 阅读次数: 0

简单地说，一个困难的决定可以简化为一系列小的越来越具体的决定。

决策树

理解：从代表数据集的根节点开始，该算法选择最能预测目标类的特征，这些案例将被划分到这一特征的不同值的组中，这一决定形成了第一组树枝。继续分而治之其他节点，每次选择最佳的候选特征，直到达到停止标准。如果一个节点停止，可能具有以下情况：

节点上几乎所有的案例属于同一类
没有剩余的特征来分辨案例之间的区别
决策树已经到达预先定义的大小限制

C5.0决策树算法

选择最佳分割
我们需要一种方式寻找分割数据的特征值，即分区中主要包含来源于一个单一类的案例。这个算法使用的是熵度量纯度。样本数据的熵表示分类值如何混杂在一起，最小值0表示是完全同质的，1表示样本凌乱的最大数量。

这里写图片描述

修剪决策树
如果决策树增长过大，将会使许多决策过于具体，模型将会过度拟合训练数据。

提前停止法：又叫预剪枝决策树法，一旦决策树达到一定数量，或者决策节点仅含有少量案例，就停止树的增长。很难把握，只有决策树生长到足够大才能学习到
后剪枝决策树法：比预剪枝更有效，如果决策树生长过大，根据节点处的错误率使用修剪准则将决策树减小到更合适的大小。
提高决策树的准确性
自适应增强：boosting算法，许多个决策树构建的过程，然后这些决策树通过投票表决的方法为每个案例选择最佳分类。可以理解为，通过将多个能力较弱的学习算法组合在一起，比任何一个单独的算法要强得多。在R软件中，一般加入参数trials=10,作为使用独立决策树的数量。不是一定能提高准确性，可以在改进算法性能的时候进行尝试。
犯比其他错误更严重的错误
代价矩阵：将惩罚因子分配到不同类型的错误上，用来指定每种错误相对于其他错误有多少倍的严重性。例如：
0 4
1 0
正确分类时没有代价，错误时有1和4两种代价。

例子：使用c5.0决策树识别高风险银行贷款。

2014乘风破浪2014

发布了164 篇原创文章 · 获赞 69 · 访问量 18万+

私信关注

猜你喜欢

转载自blog.csdn.net/wqy20140101/article/details/70921189

机器学习（四）：分而治之（上）——决策树分类

机器学习分类器---决策树

机器学习分类算法---决策树

机器学习分类篇-决策树

机器学习：分类、回归、决策树

机器学习---决策树分类代码

机器学习(十二) 决策树（上）

【机器学习】决策树（上）

机器学习之决策树（上）

机器学习：决策树（上）

机器学习之决策树(四)

机器学习（四）：决策树

机器学习【四】决策树

【机器学习】（四）决策树

机器学习导论（四）-决策树

机器学习：决策树cart算法在分类与回归的应用（上）

机器学习7-分类学习-决策树

机器学习之监督学习--（分类）决策树②

机器学习之监督学习--（分类）决策树①

【机器学习】决策树及使用sklean训练决策树分类器

【机器学习】分类决策树与回归决策树案例

【机器学习+python（8）】分类决策树的介绍与实现

机器学习第三篇——分类决策树

Python机器学习(1)——决策树分类算法

机器学习之分类决策树DecisionTreeClassifier

【机器学习】CART分类决策树+代码实现

【机器学习】分类决策树基本介绍+代码实现

机器学习sklearn（6）决策树分类

机器学习中---分类模型--决策树模型

机器学习（十一）分类算法之决策树算法

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)