Python scikit-learn，非监督学习 (没有目标值)，k-means聚类算法，KMeans - 代码天地

Python scikit-learn，非监督学习 (没有目标值)，k-means聚类算法，KMeans

其他 2019-03-04 10:11:18 阅读次数: 0

k-means，k表示聚类的目标类别数(如果不知道,就是超参数)

一般应用中是先进行k-means聚类，然后再进行分类预测。

demo.py（k-means聚类，通过轮廓系数进行评估）：

import pandas as pd
from sklearn.decomposition import  PCA
from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_score


# K-means 聚类   根据用户商品订单数据进行聚类。预测用户对某商品的喜好程度。
data = pd.read_csv("./demo.csv")

# 特征降维  PCA主成分分析
pca = PCA(n_components=0.9)  # 保留90%的信息
data = pca.fit_transform(data)
print(data.shape)  # (500, 27)   500个样本，降维到27个特征


# k-means聚类
km = KMeans(n_clusters=4)   # 假设分为4个类别。 (如果不知道类别个数，可以通过轮廓系数进行调参调优)
km.fit(data)  # 填充数据

# 聚类结果  预测
predict = km.predict(data)  # 500个样本的聚类结果
print(predict)
'''
array([1, 1, 3, 1, 1, 2, 1, 2, 0 ,..., 2, 1, 1], dtype=int32)
'''

# 轮廓系数 评估聚类效果
sc = silhouette_score(data, predict)
print(sc)  # 0.61023872302956417 (越接近1越好)
# 可以根据轮廓系数来优化K的值。

k-means优点：采用迭代式算法，直观易懂并且非常实用
缺点：最终的聚类结果可能只是局部的最优解，而不是全局的最优解(和初始随机的K个中心点有关)。（解决办法：多次进行聚类(API已自动实现)）

猜你喜欢

转载自blog.csdn.net/houyanhua1/article/details/88077128

Python scikit-learn，非监督学习 (没有目标值)，k-means聚类算法，KMeans

k-means+python︱scikit-learn中的KMeans聚类实现( + MiniBatchKMeans)

python 机器学习（一）无监督学习 + 监督学习 + 聚类算法 + k-means算法自实现

sklearn scikit-learn k-means 聚类算法一维数组聚类 python 二维数组聚类

Python机器学习聚类算法K-MEANS DBSCAN

Python每日一记19>>>无监督学习K-Means聚类

无监督学习K-means算法的python实现

无监督学习——聚类（k-means算法）

python scikit-learn学习

非监督学习—K-means算法聚类学习笔记

Kmeans 聚类及其python实现 K-means 聚类算法及 python 代码实现

Python Scikit-learn ---- SVM算法

学习：用scikit-learn学习K-Means聚类

Python机器学习算法实践——k均值聚类（k-means）

机器学习算法与Python实践之（五）k均值聚类（k-means）

机器学习之K均值聚类算法K-Means（python代码实现）

Scikit-Learn机器学习之监督学习模型案例集-新闻/邮件文本内容分类（朴素贝叶斯算法模型）

python_sklearn机器学习算法系列之K-Means(硬聚类算法)

Python 第三方模块机器学习 Scikit-Learn模块聚类

【机器学习】—— K-means聚类算法原理详解以及二维、三维数据的K-means聚类Python实现

scikit-learn之聚类算法之K-Means

机器学习K-Means及DBSCAN聚类算法的python代码

python机器学习之我见：K-means聚类算法

周志华《机器学习》Ch9. 聚类：k-means算法的python实现

Python机器学习应用之k-means聚类

K-means聚类算法-Python

机器学习（一）Python之scikit-learn回归算法学习

无监督学习-聚类 K-means聚类算法

机器学习——python scikit-learn SVC类不平衡

Python机器学习：通过scikit-learn实现集成算法

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)