机器学习实践（十七）—sklearn之无监督学习-K-means算法 - 代码天地

机器学习实践（十七）—sklearn之无监督学习-K-means算法

其他 2018-12-03 23:04:32 阅读次数: 0

版权声明：点个赞，来个评论(夸我)，随便转~ https://blog.csdn.net/qq_28827635/article/details/84679758

一、无监督学习概述

什么是无监督学习

之所以称为无监督，是因为模型学习是从无标签的数据开始学习的。
无监督学习包含算法
- 聚类
  - K-means(K均值聚类)
- 降维
  - PCA

二、K-means原理

K-means聚类步骤
1. 随机设置K个特征空间内的点作为初始的聚类中心
2. 对于其他每个点计算到K个中心的距离，未知的点选择最近的一个聚类中心点作为标记类别
3. 接着对着标记的聚类中心之后，重新计算出每个聚类的新中心点（平均值）
4. 如果计算得出的新中心点与原中心点一样，那么结束，否则重新进行第二步过程
图片助解

三、K-means - API

sklearn.cluster.KMeans(n_clusters=8,init=‘k-means++’)

k-means聚类
n_clusters
- 开始的聚类中心数量
init
- 初始化方法，默认为’k-means ++’
labels_
- 默认标记的类型，可以和真实值比较（不是值比较）

四、K-means性能评估指标

1. 轮廓系数

$sc_i = \frac{b_i-a_i}{max(b_i,a_i)}$

注：

对于每个 i 点是已聚类数据中的样本点， $b_i$ 为 i 点到其它簇中所有样本点的距离的最小值， $a_i$ 为 i 到自身簇的所有样本点的距离的平均值。最终计算出所有的样本点的轮廓系数平均值

2. 轮廓系数值分析

根据公式极端值考虑：
- 如果 $b_i >>a_i$ 那么公式结果趋近于 1，效果好。
- 如果 $a_i>>b_i$ 那么公式结果趋近于 -1，效果不好。
轮廓系数的值是介于 [-1,1] ，越趋近于1代表内聚度和分离度都相对较优。

3. 轮廓系数 - API

sklearn.metrics.silhouette_score(X, labels)

计算所有样本的平均轮廓系数
X
- 特征值
labels
- 被聚类标记的目标值

未完待续…

猜你喜欢

转载自blog.csdn.net/qq_28827635/article/details/84679758

机器学习实践（十七）—sklearn之无监督学习-K-means算法

Andrew Ng机器学习课程笔记（十二）之无监督学习之K-means聚类算法

机器学习之无监督学习--（聚类）K-Means肘部法则

机器学习之无监督学习--（聚类）Mini Batch K-Means

机器学习之无监督学习--（聚类）K-Means

sklearn无监督学习-聚类k-means

吴恩达机器学习 - 无监督学习——K-means算法吴恩达机器学习 - 无监督学习——K-means算法

python 机器学习（一）无监督学习 + 监督学习 + 聚类算法 + k-means算法自实现

Python机器学习及实践——无监督学习经典模型（K-means）

机器学习入门（十一）：回归与聚类算法——无监督学习（K-means算法）

无监督学习——聚类（k-means算法）

无监督学习之K-means算法实现

无监督学习K-means算法的python实现

非监督学习K-means算法.md

K-means算法(无监督学习)

无监督学习-K-means算法

吴恩达机器学习（十一）K-means（无监督学习、聚类算法）

吴恩达机器学习 - 无监督学习——K-means算法

机器学习算法---无监督学习，k-means聚类

[机器学习][K-Means] 无监督学习之K均值聚类

2019-07-31【机器学习】无监督学习之聚类 K-Means算法实例（图像分割）

【机器学习】K-Means（非监督学习）学习及实例使用其将图片压缩

【学习笔记】非监督学习-k-means

【机器学习笔记day27】5.1. 非监督学习之k-means

非监督学习之k-means

无监督学习之K-Means聚类

非监督学习—K-means算法聚类学习笔记

无监督学习之K-means算法通俗教程

【无监督学习】1：K-means聚类算法原理

无监督学习-聚类 K-means聚类算法

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)