李航统计学习决策树学习笔记 - 代码天地

李航统计学习决策树学习笔记

其他 2018-09-28 07:34:42 阅读次数: 0

决策树(decision tree)是一种基本的分类与回归方法。
决策树模型呈树形结构。在分类问题中，表示基于特征对实例进行分类的过程，它可以人为是if-else规则的集合，也可以认为是定义在特征空间与类空间上的条件概率分布。

if-else规则过程：
由决策树的根节点到叶节点的每一条路径对应一条规则；路径上内部结点的特征对应着规则的条件，而叶节点的类对应着规则的结论。

决策树本质是一组分类规则。

如何选择特征？
直观上，如果一个特征由更好的分类能力，就应该选择这个特征。信息增熵（information gain）能够很好地表示这一直观的准则。

随机变量的熵的定义：
$H(X)=- \sum_{i=1}^{n} p_i \log p_i$

条件熵 $H(Y|X)$ 表示在已知随机变量X的条件下随机变量Y的不确定性。定义为X给定条件下的Y的条件概率分布的熵对X的数学期望：
$H(Y|X)= \sum_{i=1}^n p_i H(Y|X=x_i)$

一般地，熵H(Y)与条件熵H(Y|X)之差，成为互信息（mutual information）
信息增益（information gain）表示得知特征X的信息而使得类Y的信息不确定性减少的程度。
特征A对训练数据集D的信息增益 g(D,A)，定义为集合D的经验熵H(D)与特征A给定条件下D的经验条件熵H(D|A)之差，即 g(D,A)=H(D)-H(D|A)

经验增益比。使用相对的概念来进行校正，这是特征选择的另一准则。
特征A对训练数据集D的信息增益比 $g_R (D,A) = \frac { g(D,A) } { H(D) }$

猜你喜欢

转载自blog.csdn.net/canwhut/article/details/81951009

李航统计学习决策树学习笔记

统计学习方法　李航　决策树

【统计学习方法-李航-笔记总结】五、决策树

李航-统计学习方法-笔记-5：决策树

《统计学习方法（李航）》决策树学习方法

李航统计学习方法决策树id3例5.3

李航《统计学习方法》——第五章决策树模型

李航统计学习第五章-决策树

决策树（统计学习方法（李航））的贷款的例子的实现

李航统计学习方法(第二版)（九）：决策树简介

(5) 李航《统计学习方法》基于Python实现——决策树

李航统计学习方法决策树的特征选择例5.2python代码

李航《统计学习方法》第五章——用Python实现决策树（MNIST数据集）

李航《统计学习方法》——第五章决策树及Python实现（附习题答案）

李航统计学习方法(第二版)（十）：决策树CART算法

《统计学习算法》决策树

统计学习之决策树

李航《统计学习方法》第2版第5章 Python编程决策树（ID3未剪枝）实现mnist数据集分类

决策树学习笔记

【学习笔记】决策树

统计学习方法笔记（九）决策树

统计学习方法笔记-决策树模型

统计学习方法笔记——决策树

《统计学习方法》笔记--决策树

统计学习方法笔记---决策树

决策树的学习

决策树学习

【转载】统计学习方法-李航（第5章决策树笔记) 这篇文章从思想的角度上看李航所表述的决策树，用简单易理解的方向去解释决策树。提出常见的三种决策树方法ID3,C4.5，同时分析他们的不同。（具体的理论部分参考原文）

统计学习方法--决策树 python实现

统计学习方法：决策树 (五)

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)