决策树核心内容

其他 2018-10-12 12:20:06 阅读次数: 0

1. 分支原则

决策树分支原则主要有3个：
1. ID3（Iterative Dichotomiser，迭代二分器）。使用香农熵 $Ent(D) =-\Sigma p_klog_2p_k$ ，信息增益表示为 $Gain(D,a) = Ent(D)-\Sigma |D^v|/|D|*Ent(D^v)$ ，其中 $a$ 的取值为 $\{a^1,a^2,...,a^V\}$ 。分支原则选信息增益最大的。
2. C4.5（Classifier 4.5）。在ID3的基础上，计算 $-Gain(D,a)/\Sigma (|D^v|/|D|log_2(|D^v|/|D|))$ ，称为信息增益率。分支原则选信息增益率最大的。
3. CART（Classification and Regression Tree，分类回归树）。使用Gini Index（基尼系数）， $Gini(D) = \Sigma\Sigma p_kp_{k'}=1-\Sigma p_k^2$ ，分支原则选基尼系数最小的。

2. 剪枝原则

剪枝原则主要有2种：
1. 预剪枝：决策树生成过程中，根据验证集决定要不要分支。
2. 后剪枝：决策树完全生成之后，根据验证集决定要不要合并分支。

3. 其他问题

首先是连续值的处理方法：对所有样本按照大小进行排序，然后将相邻两个样本的中间值依次作为划分点进行分支。
然后是缺失值的处理方法：让同样的样本以不同的概率同时划分到子节点之中去即可。
然后是复杂的决策树方法：叶子节点可能是线性分类器，而不仅仅是分类值。

猜你喜欢

转载自blog.csdn.net/kittyzc/article/details/81912204

决策树核心内容

Vuex 的核心内容

Servlet核心内容

puppet核心内容

Spring MVC核心内容

es6核心内容

网络存储核心内容概览

java 核心内容（22） LinkList

java核心内容（21） ArrayList

机器学习核心内容

神经网络核心内容

支持向量机核心内容

机器学习面试核心内容

简明Python核心内容

排序算法核心内容

Iris框架核心内容

MyBatis框架学习的核心内容

JVMGC核心内容笔记整理

点评项目核心内容

ES6核心内容（下）

ES6核心内容（上）

ES6/ES2015核心内容

阅读人月神话之核心内容

ES6 核心内容学习总结

自然语言处理核心内容

贝叶斯分类核心内容

线性回归和线性分类核心内容

springMVC中文件下载的核心内容

技术管理的核心内容——提高团队技能

代码演示反射核心内容（精）

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)