机器学习之路：python k均值聚类 KMeans 手写数字 - 代码天地

机器学习之路：python k均值聚类 KMeans 手写数字

其他 2018-04-30 09:37:58 阅读次数: 3

python3 学习使用api

使用了网上的数据集，我把他下载到了本地

可以到我的git中下载数据集： https://github.com/linyi0604/MachineLearning

代码：

 1 import numpy as np
 2 import pandas as pd
 3 from sklearn.cluster import KMeans
 4 from sklearn import metrics
 5 
 6 '''
 7 k均值算法：
 8     1 随机选择k个样本作为k个类别的中心
 9     2 从k个样本出发，选取最近的样本归为和自己同一个分类，一直到所有样本都有分类
10     3 对k个分类重新计算中心样本
11     4 从k个新中心样本出发重复23，
12         如果据类结果和上一次一样，则停止
13         否则重复234
14         
15 '''
16 '''
17 该数据集源自网上 https://archive.ics.uci.edu/ml/machine-learning-databases/optdigits/
18 我把他下载到了本地
19 训练样本3823条， 测试样本1797条
20 图像通过8*8像素矩阵表示共64个维度，1个目标维度表示数字类别
21 '''
22 
23 # 1 准备数据
24 digits_train = pd.read_csv("./data/optdigits/optdigits.tra", header=None)
25 digits_test = pd.read_csv("./data/optdigits/optdigits.tes", header=None)
26 # 从样本中抽取出64维度像素特征和1维度目标
27 x_train = digits_train[np.arange(64)]
28 y_train = digits_train[64]
29 x_test = digits_test[np.arange(64)]
30 y_test = digits_test[64]
31 
32 # 2 建立模型
33 # 初始化kMeans聚类模型 聚类中心数量为10个
34 kmeans = KMeans(n_clusters=10)
35 # 聚类
36 kmeans.fit(x_train)
37 # 逐条判断每个测试图像所属的聚类中心你
38 y_predict = kmeans.predict(x_test)
39 
40 
41 # 3 模型评估
42 # 使用ARI进行性能评估 当聚类有所属类别的时候利用ARI进行模型评估
43 print("k均值聚类的ARI值：", metrics.adjusted_rand_score(y_test, y_predict))
44 '''
45 k均值聚类的ARI值： 0.6673881543921809
46 '''
47 # 如果没有聚类所属类别，利用轮廓系数进行评估

猜你喜欢

转载自www.cnblogs.com/Lin-Yi/p/8972996.html

机器学习之路：python k均值聚类 KMeans 手写数字

机器学习实战-Python实现kMeans(k均值聚类)

机器学习（十四）：K均值聚类(kmeans)

图像分割：K均值聚类分割（Kmeans）--python实现

python机器学习手写算法系列——kmeans聚类

sklearn kmeans 手写数字聚类

吴裕雄 python 机器学习——K均值聚类KMeans模型

《机器学习实战》二分-kMeans算法（二分K均值聚类）

聚类算法-------K-均值(KMeans)算法原理和Python实现学习笔记

《机器学习实战》KMeans均值聚类算法

Python——KMeans(k均值聚类)实战(附详细代码与注解)

Kmeans聚类法-K均值

聚类算法——KMeans(K-均值)

【Kmeans】k均值聚类案例演示

【机器学习】--Kmeans聚类

机器学习-Kmeans聚类

机器学习实战（Machine Learning in Action）学习笔记————06.k-均值聚类算法（kMeans）学习笔记

python手写kmeans 简单易懂

Python之聚类（KMeans,KMeans++）

Python机器学习--聚类算法--Kmeans聚类算法

机器学习——KMeans聚类，KMeans原理，参数详解

kMeans聚类的python实现

python聚类算法kmeans

聚类算法 - KMeans - 机器学习实战

机器学习笔记：kMeans聚类

机器学习之kMeans聚类

机器学习认识聚类（KMeans算法）

机器学习-KMeans聚类算法

机器学习代码实战——KMeans（聚类）

菜鸟之路——机器学习之Kmeans聚类个人理解及Python实现

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)