【机器学习算法基础+实战系列】决策树算法 - 代码天地

【机器学习算法基础+实战系列】决策树算法

其他 2018-07-03 06:19:01 阅读次数: 0

决策树是一种基本的分类和回归模型，也就是说既可以用于分类也可以用于回归。这里以分类为例。
决策树模型一种描述对实例依据特征进行分类的树形结构，它包含一个根节点，若干个内部节点和若干个叶节点。其中叶节点对应的是决策结果，也可以说是一个类，内部节点表示的是一个属性和特征。
决策树的学习算法包含三个步骤：特征选择，决策树的生成，决策树的剪枝

特征选择

特征选择在于选取对训练数据具有较好分类能力的特征，如果选取的特征进行分类的结果与随机分类的结果没有很大的差别，那么就不能说这个特征具有很好的分类能力。从经验上来讲，扔掉这些特征，对决策树的学习在精度上不会有影响。
通常特征选择的准则我们采取的是信息增益或者信息增益比。

信息增益：

首先我们给出熵的定义：熵表示的随机变量的不确定性。
设\(X\) 是一个取有限个值的离散随机变量，其概率分布为：\[P(X=x_{i})=p_{i}, i = 1,2,3,...,n\]
则随机变量的熵定义为: \[ H(X) = -\sum_{i=1}^{n}p_{i}logp_{i}\]
通常条件下，式子中的对数我们以2或者e为底数。若\(p_{i} = 0, 则定义0log0=0\)。由定义公式我们可以知道熵只依赖于X的分布，而与X的取值无关。所以我们也可以将这个式子改写成:\[ H(p) = -\sum_{i=1}^{n}p_{i}logp_{i}\]
熵越大，随机变量的不确定性就越大，从定义我们可以知道：\(0\leq H(p) \leq logn\)
接下来我们给出条件熵的定义。设有随机变量(X,Y),其联合概率分布是

猜你喜欢

转载自www.cnblogs.com/lzida9223/p/9256645.html

【机器学习算法基础+实战系列】决策树算法

机器学习实战决策树算法

机器学习：决策树算法实战

机器学习实战——决策树算法

机器学习算法基础——决策树

《机器学习实战》笔记03~决策树算法

机器学习算法及实战——决策树代码（四）

机器学习算法及实战——决策树代码实现（三）

机器学习算法及实战——决策树（二）

机器学习算法及实战——决策树（一）

机器学习实战之决策树算法

机器学习算法系列————决策树（二）

机器学习基础学习笔记——决策树算法

机器学习算法基础五决策树实践

机器学习算法基础四决策树

【机器学习基础】决策树分类算法

机器学习基础之《分类算法（6）—决策树》

机器学习算法总结--决策树

机器学习之决策树算法

【机器学习】【决策树】算法详解

机器学习算法（三）：决策树

机器学习决策树算法探究

机器学习算法（2）决策树

机器学习算法——决策树

机器学习-决策树算法

[机器学习算法]决策树

机器学习算法之决策树

机器学习——决策树算法详解

机器学习算法--决策树2

机器学习算法--决策树

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)