机器学习算法系列————决策树(二)

1.什么是决策树

用于解决分类问题的一种算法。
请添加图片描述
左边是属性,右边是标签。
请添加图片描述
属性选择时用什么度量,分别是信息熵和基尼系数。
这里能够做出来特征的区分。

请添加图片描述

下图为基尼系数为例进行计算。
请添加图片描述

请添加图片描述
下面两张图是对婚姻和年收入的详细计算过程(为GINI系数为例。)决策树连接一是以信息熵为例进行计算的。
请添加图片描述
这里需要声明一下,可能作者计算的分类方式为(0-60k)(60k-80k)(80k-300k)
请添加图片描述

最终建立好的决策树模型如下。
请添加图片描述

猜你喜欢

转载自blog.csdn.net/guoguozgw/article/details/132701400