机器学习：原型聚类-k均值算法k-means(附代码实现) - 代码天地

机器学习：原型聚类-k均值算法k-means(附代码实现)

其他 2018-08-07 10:16:20 阅读次数: 0

首先，聚类的目的是将样本划分为若干个通常不相交的子集，子集内部的样本存在着某种潜在的关系。

k均值算法的核心思想是最小化如下的平方误差：

这个式子表达了聚类内的样本和该聚类的均值向量的紧密程度，E越小则聚类内的样本越紧密。

然而，最小化这个式子是NP难问题，不能快速解决。k均值算法采用了迭代优化的贪心算法：

为了避免运行时间过长，可以认为设定循环轮数或最小调整的幅度阈值。

下图是经过不同迭代轮数后的聚类效果（k=3）：

python代码实现：

#聚类数
k = 3
#迭代轮数
for l in range(loops):
    #均值向量是否更新初始化
    mp_refreshed = False
    #聚类结果
    result = {0:[],1:[],2:[]}
    #将全部样本分配到各个聚类
    for i in range(len(x)):
        min_dist = sum((x[i]-mean_point[0])**2)
        #样本所属聚类
        k_flag = 0
        #样本分配到距离最近的聚类
        for j in range(1,k):
            #样本离均值向量的距离
            dist = sum((x[i]-mean_point[j])**2)
            if dist<min_dist:
                min_dist = dist
                k_flag = j
        result[k_flag].append(i)
    #更新均值向量
    for i in range(k):
        x_sum = np.array([0,0])
        for j in range(len(result[i])):
            x_sum = np.add(x_sum,x[result[i][j]])
        #新的均值向量
        new_mp = x_sum / len(result[i])
        if (mean_point[i]!=new_mp).any():
            mean_point[i] = new_mp
            mp_refreshed = True
    #所有均值向量都没更新，结束迭代
    if not mp_refreshed:
        break
print(l,result)

参考资料：周志华《机器学习》

相关博文：

机器学习：聚类-性能度量指标简介（附代码实现）

机器学习：聚类-闵科夫斯基距离和无序属性的VDM距离计算

机器学习：原型聚类-学习向量量化LVQ算法浅析（附代码实现）

猜你喜欢

转载自blog.csdn.net/weixin_35732969/article/details/81126746

机器学习：原型聚类-k均值算法k-means(附代码实现)

机器学习之K均值聚类算法K-Means（python代码实现）

K-means均值聚类算法python代码实现

ML-61: 机器学习之K均值(K-Means)聚类算法+代码

K-Means K均值聚类 python代码实现

机器学习（聚类三）——K-Means 代码实现

K均值聚类算法(K-Means) K均值聚类算法(K-Means)

机器学习实战学习笔记 ---- K-Means（K-均值）聚类算法

机器学习之K均值算法（K-means）聚类

Python机器学习算法实践——k均值聚类（k-means）

机器学习算法与Python实践之（五）k均值聚类（k-means）

机器学习——K-均值聚类（K-means）算法

机器学习（二）——K均值聚类算法（K-means）

机器学习（二）——K-均值聚类（K-means）算法

机器学习-聚类之K均值(K-means)算法原理及实战

机器学习 K-均值聚类算法(K-Means)

机器学习算法之_K-均值聚类（K-means）

机器学习之k均值算法(K-means)聚类

机器学习实战：K-Means（K-均值）聚类算法

【机器学习实战之三】：C++实现K-均值（K-Means）聚类算法

用python实现K-Means均值聚类算法

机器学习——聚类算法之K-means与K-means++,K-meansⅡ

Python实现k均值聚类算法_K-Means聚类算法

不足20行 python 代码，高效实现 k-means 均值聚类算法

机器学习——K-means算法（聚类算法）

机器学习 - 算法 - 聚类 K-MEANS 算法

K-means(K-均值)聚类算法

K-均值聚类算法(K-Means)

K-均值聚类（K-means）算法

【ML】K均值聚类算法 (K-means Clustering)

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)