机器学习之决策树理解进阶 - 代码天地

机器学习之决策树理解进阶

其他 2020-03-19 13:57:32 阅读次数: 0

整理自《统计学习方法——李航》

如果只是根据最后的结果对样本进行分类，那么直接可以分成两类，一类是“是”，一类是“否”。

根据前面讲的信息增益，这里的经验熵为：

然后还可以进行分类再计算。比如先分成是否是老年人还是中年或者青年人，然后再继续下分类别。

假设我们设置两层分类：

那么经过计算以后得到新的信息熵：

计算得到值 0.888

所以信息增益为0.971-0.888=0.083.

同理，还可以根据是否有工作进行两级分类，以及根据是否有房子进行两级分类。得到的信息增益各不相同。信息增益最大的分类方式则可以认为是最好的分类方式。

ID3算法详解。

书中已经说得非常明白了，这里也仅仅整理一下结果：

在进行了第一轮的分类以后，我们选择用是否有自己的房子作为第一个树节点，因为它的信息增益最大。

然后我们开始进行第二轮分类。第二轮我们判断下一种用于分类的特征：

因为有房子，则分类全都是“是”，所以不用再继续细分了。

如果没有房子，则可以根据下一种分类特征进行分类，剩余的三种特征分类的信息增益如下：

所以我们选择第二个特征作为新的分类方式，即有没有工作。

然后发现有工作的都是“是”。没有工作的都是“否”。如此，分类完毕。

缺点是在不断细分的过程中会造成过拟合现象，所以需要使用改进的算法。

C4.5算法。

C4.5就是设定阈值。如果在某一个树枝的最大的信息增益小于该阈值，则不继续进行分类，而是把该树枝中比例最大的一个类别作为该树枝的分类结果。

Dezeming

发布了132 篇原创文章 · 获赞 167 · 访问量 7107

私信关注

猜你喜欢

转载自blog.csdn.net/tiao_god/article/details/104768761

机器学习之决策树理解进阶

机器学习之决策树

机器学习之决策树算法

机器学习之笔记-决策树

机器学习之决策树总结

机器学习系列之决策树

机器学习之决策树

机器学习之决策树(四)

python机器学习之决策树

机器学习实战之决策树

机器学习算法之决策树

机器学习之决策树（二）

机器学习之决策树（一）

机器学习之决策树（上）

机器学习sklearn之决策树

机器学习之决策树介绍

机器学习之决策树

机器学习模型之决策树

机器学习之决策树（实战）

【机器学习之决策树】

机器学习小结之决策树

机器学习之决策树（机器学习技法）

机器学习之决策树——《机器学习》周志华著

【机器学习】统计学习方法之决策树理解摘要

决策树学习之概念理解和代码实现

机器学习算法——决策树之CART树

机器学习之决策树学习笔记

系统学习机器学习之决策树

机器学习之监督学习--（分类）决策树②

机器学习之监督学习--（分类）决策树①

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

周排行

面试爱奇艺，竟然挂在第5轮……

scala方法和函数的区别

NYIST--2018大一新生第一次周赛题解

java如何通过client客戶端http实现get/ post请求传递json参数到restful 服务接口

RabbitMQ 队列类型

2018-2019-1 20165311 20165329 20165334 实验一开发环境的熟悉

iOS打包工具配置相应的文件路径一键打包到指定位置

【每日一题】替换空格

【转载】FPGA配置方式

旅行青蛙

每日归档

更多

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)