Classification Tree

其他 2018-05-08 09:51:58 阅读次数: 4

ID3->C4.5->C5.0

Decision Tree theory

1、所有的数据放在根节点

2、分堆

注意事项：

1、属性选择的结果是目标变量偏向于一个值

2、砍树。（防止过拟合）

1、越倾向于1越平均化；倾向于0越偏某一类。交叉熵在0-1之间。

注意事项

1、决策树和规则不一样。规则是提取的精华。决策树是有繁琐的规则在的。

2、分类规则的算法和决策树不一样。WEKA提供。modeler不提供分类规则算法。

ID3的缺点：

1、字段选择的时候，喜欢分支度越多。使得一个分支趋向于0或者1。因为这样会使Information Gain增大。（比如 ID进入决策树，在测试机无法预测。

2、所有的变量是离散的。无法处理离散的数据。

3、没法处理空值

4、无法砍树，无法防止过拟合。

ID3 每个节点的分支度不同。

C4.5的改进：

C4.5的特点

1、可以处理数值型数据。找Gain ration 的最大切点。可以分为二叉树的类型；类别型的话有几类分几类。

2、可以砍树。

修剪法：从下往上（C4.5/CART)

盆栽法：（top-down）--CHAID

在25% 的信息水准下：

在这样的水平下，在信息水准的水平下。错误率会提升。

3、C4.5可以处理空值和数值型的字段。

CART算法：

Gini =[0-1/2] 之间 0（偏某类）-1/2 （平均）

熵：越趋向于1越平均。

注意事项：

1、可以重复使用各个节点。

2、CART的砍树方法：

CART：可以处理数值型字段；可以砍树。

CHAID:

猜你喜欢

转载自blog.csdn.net/weixin_40446764/article/details/79446041

Classification Tree

CART（Classification And Regression Tree）

Decision Tree (Classification & Regression Algorithms)

SAP Material Type on Classification Tree(ClassMaster management)

Classification

决策树分类(decision tree classification)和python实现

06_Decision Trees_01_graphviz_Gini_Entropy_Decision Tree_CART_prune_Regression_Classification_Tree

机器学习实战（八）分类回归树CART（Classification And Regression Tree）

Classification: Cart

Classification : Bayesian

Classification:Winnow

Classification:Boosting

Classification:preceptron

classification(分类)

Python(Classification)

Classification学习

Classification trees

Online Classification

Text Classification

Classification loss

tree

Is It A Tree?

Classification : Random Forests

Classification:Online Passive Aggressive

Classification : Logistic Regression (SGD)

Matlab Classification Learner

Iris Classification Neural Network

PyTorch 实现 Classification 分类

Classification and Decision Trees

funcation location分配classification

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)