k-均值 聚类算法

  首先初始化k个点作为质心,遍历数据集,把每一个数据点分配到距离最近的质心,把这个质心下的所有点的均值作为新的质心,迭代更新。

  度量聚类效果的指标:SSE( sum of squared error)误差平方和
改进算法:二分-k-均值算法(克服k-均值局部收敛)

二分-k-均值 聚类算法  
  将所有点看成一个簇,利用2均值聚类将簇一分为二,选择SSE最大的簇进行划分,直到达到用户指定的分类数。

猜你喜欢

转载自blog.csdn.net/u011243684/article/details/84937619