一.概述
1.概念:
"聚类"(Clustering)是指按某个标准把数据集分割成不同的类(称为"簇"),使同1个簇内的数据大小尽可能相似,而不同簇中的数据对象尽可能不相似.
聚类和分类的区别在于,聚类不会预设类别.也就是说,聚类属于无监督学习
2.常用算法的分类
参见:https://blog.csdn.net/count_on_me/article/details/82193745
(1)基于划分的聚类(Partition-based Clustering):
"基于划分的聚类"(Partition-based Clustering)的基本思想是:①确定簇的数量 ②挑选初始中心点 ③利用预先选定的启发式算法对数据点进行
"迭代重置"(Iterative Relocation),直到满足停止条件后跳出.这类算法包括k-均值算法及其变体
(2)层次聚类:
"层次聚类"(Hierarchical Clustering)的主要分为:"合并的层次聚类"和"分裂的层次聚类"
(3)基于密度的聚类:
(4)基于网格的聚类:
(5)基于模型的聚类:
(6)基于模糊的聚类:
二.相关算法