机器学习 聚类问题

一.概述
1.概念:

"聚类"(Clustering)是指按某个标准把数据集分割成不同的类(称为"簇"),使同1个簇内的数据大小尽可能相似,而不同簇中的数据对象尽可能不相似.
聚类和分类的区别在于,聚类不会预设类别.也就是说,聚类属于无监督学习

在这里插入图片描述
2.常用算法的分类

参见:https://blog.csdn.net/count_on_me/article/details/82193745

(1)基于划分的聚类(Partition-based Clustering):

"基于划分的聚类"(Partition-based Clustering)的基本思想是:①确定簇的数量 ②挑选初始中心点 ③利用预先选定的启发式算法对数据点进行
"迭代重置"(Iterative Relocation),直到满足停止条件后跳出.这类算法包括k-均值算法及其变体

(2)层次聚类:

"层次聚类"(Hierarchical Clustering)的主要分为:"合并的层次聚类""分裂的层次聚类"

(3)基于密度的聚类:


(4)基于网格的聚类:


(5)基于模型的聚类:


(6)基于模糊的聚类:


二.相关算法

猜你喜欢

转载自blog.csdn.net/weixin_46131409/article/details/113827532
今日推荐