数据科学家需要了解的5大聚类算法 - 代码天地

数据科学家需要了解的5大聚类算法

编程语言 2018-11-30 00:33:08 阅读次数: 0

聚类是一种涉及数据点分组的机器学习技术。给定一个数据点集，则可利用聚类算法将每个数据点分类到一个特定的组中。理论上，同一组数据点具有相似的性质或（和）特征，不同组数据点具有高度不同的性质或（和）特征。聚类属于无监督学习，也是在很多领域中使用的统计数据分析的一种常用技术。本文将介绍常见的5大聚类算法。

K-Means算法

K-Means算法可能是最知名的聚类算法，该算法在代码中很容易理解和实现。

4fdc1d83d0f68ed6a5771cebd6b128d1d96cf557

K-Means聚类

1.首先我们选择一些类或组，并随机初始化它们各自的中心点。为了计算所使用类的数量，最好快速查看数据并尝试识别任何一个不同的分组。中心点是和每个数据点矢量长度相同的矢量，上图标记为“X”。

2.每个数据点是通过计算该点与每个组中心的距离进行分类的，然后再将该点分类到和中心最接近的分组中。

3.根据这些分类点，通过计算群组中所有向量的均值重新计算分组中心。

4.重复以上步骤进行数次迭代，或者直到迭代之间的组中心变化不大。选择结果最好的迭代方式。

因为我们只是计算点和组中心之间的距离，计算量很少，所以K-Means算法的速度非常快，具有线性复杂度O(n)。

K-Means算法的缺点是必须选择有多少个组或类，因为该算法的目的是从不同的数据中获得信息。另外，K-means算法从随机的选择聚类中心开始，因此不同的算法运行可能产生不同的聚类结果。其结果缺乏一致性，而其他聚类方法结果更一致。

原文链接http://click.aliyun.com/m/1000026942/

猜你喜欢

转载自blog.csdn.net/weixin_40581617/article/details/84629929

数据科学家需要了解的5大聚类算法

关于DevOps，数据科学家需要了解这些

数据科学家必须了解的六大聚类算法：带你发现数据之美

数据科学家必须要掌握的5种聚类算法

一文盘点5种聚类算法，数据科学家必备！

关于自然语言处理，数据科学家需要了解的 7 项技术

数据科学家需要了解的15个Python库

每位数据科学家应该了解的5种异常点（变化点）检测算法

数据科学家需要掌握的10大统计技术

数据科学家常用的十大机器学习算法，都在这了！

数据科学家与分析师需要掌握的技能

数据科学家最需要什么技能？ | 资讯

数据科学家最需要什么技能？

数据科学家需要掌握的Docker要点

数据科学家面临的八大挑战

菜鸟数据科学家五大误区

数据科学家的来历

数据科学家的起源

数据科学家的定义

【数据科学家】什么是数据科学？

这5个Python库太难搞！每位数据科学家都应该了解

什么是数据科学，合格的数据科学家需要具备什么能力？

每一位数据科学家都应掌握的10大机器学习算法

数据科学中必须熟知的5种聚类算法

操作系统（科学家算法）

【数据科学】数据科学家必需熟知的5个基本统计概念

成为数据科学家的入门项目

《数据科学家修炼之道》笔记

数据科学家Docker入门指南

数据科学家成长指南(下)

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)