python——k-means聚类（余弦距离，用轮廓系数确定聚类系数K） - 代码天地

python——k-means聚类（余弦距离，用轮廓系数确定聚类系数K）

其他 2018-05-30 11:27:11 阅读次数: 1

用scikit-learn进行k-means聚类，默认使用欧式距离，为了用余弦距离作为度量，找了一个在生物信息学里比较常用的库：Biopython。Biopython为k-means聚类提供了各种距离函数，包括余弦距离、皮尔逊相似度量、欧式距离等。

另外，为了确定一个合理的聚类系数，采用轮廓系数作为衡量标准：

轮廓系数取值为[-1, 1]，其值越大越好。

from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_score
from Bio.Cluster import kcluster
from Bio.Cluster import clustercentroids
import matplotlib.pyplot as plt
%matplotlib inline
import numpy as np
data=np.load('/home/philochan/ResExp/genderkernel/1.npy')
coef = []
x=range(3,20)
for clusters in x:
    clusterid, error, nfound = kcluster(data, clusters, dist='u',npass=100)
    silhouette_avg = silhouette_score(data, clusterid, metric = 'cosine')
    coef.append(silhouette_avg)
  
e =[i+3 for i,j in enumerate(coef) if j == max(coef)]
print e
print coef
plt.plot(x,coef)
plt.show()

猜你喜欢

转载自blog.csdn.net/chenxjhit/article/details/80316144

python——k-means聚类（余弦距离，用轮廓系数确定聚类系数K）

python sklearn：聚类-k-means，聚类趋势，簇数确定，测定聚类质量

K-means聚类原理实现优缺点轮廓系数调优Canopy算法

k-means聚类个数k的确定

用python实现K-Means均值聚类算法

K-Means聚类的Python实践

Python实现K-means聚类

K-means聚类算法-Python

K-MEANS聚类

聚类——K-means

K-Means（聚类）

K-means 聚类

无监督学习聚类、相似度指标、K-Mediods、K-Means算法、K-Means++、Canopy聚类算法、聚类算法评估指标、轮廓系数、层次聚类、密度聚类、谱和谱聚类

K-means聚类及距离度量方法小结

K-means聚类算法 k-means聚类算法python实现

K-Means K均值聚类 python代码实现

Python数据分析案例27——PCA-K均值-轮廓系数客户聚类

【代码模版】轮廓系数确定聚类类数及可视化展示

K均值聚类算法(K-Means) K均值聚类算法(K-Means)

[学习笔记] [机器学习] 8. 聚类算法（聚类算法：K-means、K-means++；特征降维：Pearson相关系数、Spearman相关系数、PCA主成分分析）

k-means聚类算法

K-means聚类算法初探

聚类算法k-means

K-Means聚类及图像压缩

k-Means算法，聚类算法

聚类算法——K-means（上）

理解K-means聚类算法

聚类算法：K-means算法

聚类算法：K-Means

（十八）K-Means聚类算法

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)