第九章　聚类　Clustering - 代码天地

第九章　聚类　Clustering

其他 2018-05-30 05:18:01 阅读次数: 1

第九章　聚类

(Unsupervised Learning)无监督学习:
　　　　训练样本的标记信息是未知的，通过对无标记数据的训练来找出数据内部所存在的规律以及性质．为进一步的数据分析打下基础

１．知识点

聚类过程中会自动的形成簇结构，但是算法对簇(cluster)没有概念，这是在运算过程中自己出现的聚类现象，这个簇的名字需要自己来进行定义

聚类可作为一个单独的过程来完成，用于去寻找数据的内部性质及分布结构，当然也可以作为分类等其他学习任务的前驱过程．

当对数据的类不是很明确的时候，可以将数据先进行聚类，根据聚类结果将每个簇定义为一个类，再基于这些类进行训练分类模型

性能度量（performance measure）

性能度量也叫聚类的”有效性指标（validity index）”
物以类聚：
　　　　簇内相似度高，簇间相似度低．

%E9%80%89%E5%8C%BA_001.png

%E9%80%89%E5%8C%BA_002.png

距离计算（distance measure）

%E9%80%89%E5%8C%BA_003.png

闵科夫斯基距离，这是一种最常用的距离
可以变形成欧式距离和曼哈顿距离（典型的街区距离公式）　　这都是经典的距离公式．

一个小插曲：公式在推导过程中经常会强调不失一般性，这个＂不失一般性＂是什么意思？

原型聚类：第一步原型的初始化，第二步对根据不同的公式进行迭代优化更新求解．

K-means算法，根据最小平方差公式（最小二乘法）来进行迭代优化

递归＆迭代

简单来说：递归就是函数不断的调用自己，
　　　　　迭代就是函数Ａ不断调用函数Ｂ的过程

知识点有点复杂，相对知识较多，还没有完整的理论体系，先不着急学习．

猜你喜欢

转载自blog.csdn.net/qq_37904945/article/details/80338610

第九章　聚类　Clustering

第九章聚类

西瓜书笔记-第九章聚类

《机器学习》第九章聚类

task8 第九章聚类

机器学习第九章聚类

聚类机器学习第九章

第九章-类

Python第九章类

第九章类

第九章类与对象

Clustering(聚类)

聚类方法（Clustering）

读书笔记-《机器学习》第九章：聚类

机器学习(周志华) 参考答案第九章聚类

《机器学习》西瓜书第九章聚类

西瓜书学习笔记第九章聚类

【一起啃书】《机器学习》第九章聚类

【Week 5.1】第九章（类）

第九章类和对象

[Python]《从入门到实践》第九章-类

第九章：对象和类

第九章 Caché 定义持久类

第九章(java的常用类)

第九章：Java常用类

《机器学习》西瓜书第九章聚类（二）原型聚类、密度聚类、层次聚类

聚类——层次聚类（Hierarchical Clustering）

8.3聚类（Clustering）:hierarchical clustering 层次聚类

聚类(Clustering) hierarchical clustering 层次聚类应用

Spectral Clustering（谱聚类）

今日推荐

周排行

例题2-6 数据统计II（多组数据的统计）

类百度富文本编辑器文件上传。

Activity setContentView主要流程

增长的核心之减少用户阻力的三大原则

分布式服务框架原理与实践

C语言-预处理、结构体

UVA11300 Spreading the Wealth【思维】

linux内核支持usb转串口，内存设备

iOS开发笔记之跳转QQ聊天页、跳转微信、应用内拨打电话

Java面试通关要点汇总集，互联网面试官如何面试

每日归档

更多

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)

2024-07-27(0)

2024-07-26(0)

2024-07-25(0)

2024-07-24(0)

2024-07-23(0)

2024-07-22(0)

2024-07-21(0)