决策树ID3

ID3算法:倾向于选择分支多的选项作结点
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
首先是离散型的数据,按公式求增益,选最大的那个选项作为分裂结点
在这里插入图片描述
关于求Infor_A(D)式子的解释,第一个5/14是youth,后面的2/5是yes,3/5是no

然后是连续型的数据
在这里插入图片描述
左边有七个年龄,右边是六个邻值均值,然后六个均值各切一刀计增益,选最高增益的即可

补充:
在这里插入图片描述

PS:样本有缺失项的情况未深入研究

猜你喜欢

转载自blog.csdn.net/cj1064789374/article/details/87954452