常见分类算法

常见分类算法

朴素贝叶斯网络、贝叶斯信念网络、随机森林、k-最近邻分类

云聚类算法引擎

k-Means、Canopy、Fuzzy K-Means、Mean Shift

云关联规则算法引起

FP-Growth关联规则

云智能推荐算法引擎

基于内存的协同过滤、基于模型的协同过滤

主要的分类与预测算法:

回归分析、决策树、随机森林、贝叶斯网络、支持向量机

决策树

描述:决策树是一种树状结构,他的每一个叶节点对应一个分类,非叶节点对应在某个属性上的划分,根据样本在该属性上的不同区直将其划分成若干子集。
关键词:自上而下,分而治之
常用的决策树算法:

ID3算法:其核心是在决策树的各级节点上,使用信息增益方法作为属性的选择标准,以帮助确定生成每个节点时应采用的合适属性
C4.5算法:相对于ID3算法的重要改进是使用信息增益率来选择节点属性。可以克服ID3算法存在的不足:ID3算法只适用于离散的描述属性,而C4.5算法既能够处理离散的描述属性,又可以处理连续的描述属性
CART算法:是一种十分有效的分参数分类和回归方法,通过构建树、修剪树、评估树来古剑一个二叉树。当终结点是连续变量时,该树是回归树;当终结点是分类变量时,该树为分类树

ID3算法的具体流程:
1)对当前样本及和计算所有属性的信息增益;
2)选择信息增益最大的属性作为测试属性,把测试属性取值相同的样本华为同一个子样本集。
3)若字眼本机的类别属性值含有单个属性,则分支为叶子节点,判断其属性值并表上相应的符号,然后返回调用出;否则对子样本集递归调用本算法。

猜你喜欢

转载自blog.csdn.net/xielinrui123/article/details/80348621