python数据分析与挖掘之聚类kmeans算法 - 代码天地

python数据分析与挖掘之聚类kmeans算法

其他 2018-12-08 12:27:47 阅读次数: 0

聚类不指定类别进行分类

（划分（分裂）法，层次分析法、密度分析法）、网格法、模型法

Kmeans算法属于分裂法

随机选择k各点作为聚类中心
计算各个点到这K个点的距离
将对应的点聚到与它最近的这个聚类中心
重新计算聚类中心
比较当前聚类中心与前一次聚类中心，如果是同一个点，得到聚类结果，若不同的点，则重复2-5

Kmeans算法实现代码：

#kmeans算法
'''
#通过程序聚类实现实现录取学生的聚类
import pandas as pda
import numpy as npy
import matplotlib.pylab as pyl
fname='E:\\programCode\\huigui.csv'
dataf=pda.read_csv(fname)
x=dataf.iloc[:,1:4].as_matrix()
from sklearn.cluster import Birch
from sklearn.cluster import KMeans

kms=KMeans(n_clusters=4,n_jobs=2,max_iter=500)#聚为4类，线程数为2，最大循环次数500
y=kms.fit_predict(x)#进行聚类
#可视化
#x代表学生序号，y代表学生类别
s=npy.arange(0,len(y))
pyl.plot(s,y,'o')
pyl.show()
'''
#通过程序实现商品的聚类
import pandas as pda
import numpy as npy
import matplotlib.pylab as pyl
import pymysql
conn=pymysql.connect(host='localhost',user='root',passwd='123456',db='dd')
sql="select price,comment from jd limit 300"
dataf=pda.read_sql(sql,conn)
x=dataf.iloc[:,:].as_matrix()
from sklearn.cluster import KMeans

kms=KMeans(n_clusters=3)
y=kms.fit_predict(x)

for i in range(0,len(y)):
    if(y[i]==0):
        pyl.plot(dataf.iloc[i:i+1,0:1].as_matrix(),dataf.iloc[i:i+1,1:2].as_matrix(),'*r')
    elif(y[i]==1):
        pyl.plot(dataf.iloc[i:i+1,0:1].as_matrix(),dataf.iloc[i:i+1,1:2].as_matrix(),'sy')
    else:
        pyl.plot(dataf.iloc[i:i+1,0:1].as_matrix(),dataf.iloc[i:i+1,1:2].as_matrix(),'*k')    

pyl.show()

猜你喜欢

转载自blog.csdn.net/xx20cw/article/details/84888041

python数据分析与挖掘之聚类kmeans算法

kmeans 聚类前的数据分析

【数据挖掘】 kmeans聚类算法的原理与实现 (使用matlab)

Python数据挖掘—聚类—KMeans划分法

聚类算法之Kmeans

python聚类算法kmeans

Python之聚类（KMeans,KMeans++）

十大经典数据挖掘算法之k-means kmeans聚类理论篇

《Python数据分析与数据挖掘实战》第十四章学习——层次聚类

聚类算法之kmeans算法

《Python数据分析与挖掘实战》第七章学习——K-means聚类

《Python数据分析与挖掘实战》第14章——层次聚类

KMeans聚类算法分析以及实现

算法实现之----聚类KMeans

易懂：聚类算法之Kmeans

Python机器学习--聚类算法--Kmeans聚类算法

全面解析Kmeans聚类算法（Python）

Kmeans聚类算法

聚类算法Kmeans

Kmeans 聚类算法

数据挖掘聚类算法

数据挖掘聚类算法

R-数据挖掘-聚类Kmeans（六）

数据挖掘--模型挖掘之聚类

Kmeans算法聚类算法

《数据分析实战》总结二之聚类算法：K-Means，EM

机器学习算法之聚类算法Kmeans并找出最佳K值的Python实践

驾驶类型聚类-Kmeans聚类算法和PCA降维算法——东北大学数据挖掘实训五

聚类分析 | 概述、 k均值聚类算法 KMeans 处理数据及可视化

【聚类算法】Kmeans聚类

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)