[吴恩达机器学习笔记]15非监督学习异常检测7-8使用多元高斯分布进行异常检测

其他 2018-09-11 18:52:42 阅读次数: 0

15.异常检测 Anomaly detection

觉得有用的话,欢迎一起讨论相互学习~Follow Me

15.7-8 多变量高斯分布/使用多元高斯分布进行异常检测 -Multivariate Gaussian distribution/ Anomaly Detection using the Multivariate Gaussian Distribution

示例

假设下图所示的是数据中心监测计算机是否异常的CPU加载和内存占用的特征分布，：
现使用高斯分布对特征进行拟合，计算出P(x),此时绿色的点表示 异常的样本点(CPU负载很低但是内存占用很高)，但是根据两个变量的高斯分布单独进行拟合发现其并没有错误其距离中心并不是很远，即表示考虑单变量高斯分布，其P(x_test)并不是很小， 玫红色圆圈表示使用单变量高斯分布得到P(x)的等高线图 ，所以其并不会被判定为异常数据点

多元高斯分布

在一般的高斯分布模型中，我们计算 p(x)的方法是：通过分别计算每个特征对应的几率然后将其累乘起来，在多元高斯分布模型中，我们将构建特征的协方差矩阵，用所有的特征一起来计算 p(x)。
一般的高斯分布模型：
多元高斯分布计算步骤：
1. 计算所有m个样本$x^{(i)}$(每个样本都可以表示为一个1 * n的向量)每个特征的平均值(对应特征求平均)$\mu$所以$\mu$也是一个1 * n的向量，向量中的每个单元都是所有样本对应特征的平均值。
2. 计算样本协方差矩阵，协方差矩阵计算方法请点此处
3. 最后我们计算多元高斯分布的 p(x):
  
  其中，协方差矩阵使用Σ表示，使用|Σ|表示Σ矩阵的行列式，使用$Σ^{-1}$表示矩阵的逆。

协方差矩阵对多元高斯模型的影响

上图是 5 个不同的模型，从左往右依次分析：

是一个一般的高斯分布模型
通过协方差矩阵，令特征1拥有较小的偏差，同时保持特征2的偏差
通过协方差矩阵，令特征2拥有较大的偏差，同时保持特征1的偏差
通过协方差矩阵，在不改变两个特征的原有偏差的基础上，增加两者之间的正相关性
通过协方差矩阵，在不改变两个特征的原有偏差的基础上，增加两者之间的负相关性

多元高斯分布模型与原高斯分布模型的关系

可以证明的是，原本的高斯分布模型是多元高斯分布模型的一个子集，即像上图中的第1、2、3，3 个例子所示，如果协方差矩阵只在对角线的单位上有非零的值时，即为原本的高斯分布模型了。

原高斯分布模型和多元高斯分布模型的比较

原高斯分布模型	多元高斯分布模型
不能捕捉特征之间的相关性但可以通过将特征进行组合的方法来解决(例如对特征进行加法或乘法)	自动捕捉特征之间的相关性
计算代价低，能适应大规模的特征	计算代价较高训练集较小时也同样适用(因为需要计算协方差矩阵的行列式和逆)
	1.必须要有 m>n，否则协方差矩阵不可逆，通常需要 m>10n;2. 特征冗余(比如两个向量间线性相关，有加法或乘法的关系)也会导致协方差矩阵不可逆

原高斯分布模型被广泛使用着，如果特征之间在某种程度上存在相互关联(线性相关)的情况，可以通过构造新特征的方法来捕捉这些相关性
如果训练集不是太大，并且没有太多的特征，可以使用多元高斯分布模型

猜你喜欢

转载自www.cnblogs.com/cloud-ken/p/9629539.html

[吴恩达机器学习笔记]15非监督学习异常检测7-8使用多元高斯分布进行异常检测

机器学习笔记 —— 多元高斯分布及使用多元高斯分布实现异常检测

吴恩达机器学习（十三）异常检测（高斯分布）

[吴恩达机器学习笔记]15.1-3非监督学习异常检测算法/高斯回回归模型

机器学习系列文章：多元高斯分布（异常检测）

Stanford机器学习-异常检测和多元高斯分布

吴恩达机器学习之异常检测(Anomaly Detection)（一）：问题的动机、高斯分布（详细笔记，建议收藏，已有专栏）

吴恩达机器学习笔记8-异常检测

斯坦福大学机器学习笔记——异常检测算法（高斯分布、多元高斯分布、异常检测算法）

吴恩达《机器学习》课程总结（15）异常检测

《吴恩达机器学习》15 异常检测

吴恩达机器学习 - 异常检测

吴恩达机器学习—异常检测

吴恩达机器学习——异常检测

吴恩达机器学习笔记 —— 16 异常点检测

吴恩达老师机器学习笔记异常检测（一）

吴恩达机器学习之异常检测(Anomaly Detection)（二）：算法、开发和评价一个异常检测系统、异常检测与监督学习对比（详细笔记，建议收藏，已有专栏）

吴恩达机器学习 - 异常检测吴恩达机器学习 - 异常检测

关于什么时候用异常检测和监督学习，以及多元高斯模型的使用

吴恩达机器学习课程笔记+代码实现(24)15.异常检测(Anomaly Detection)

吴恩达机器学习入门笔记14/15-异常检测问题/推荐系统

机器学习-异常检测（高斯分布模型）-Python代码

机器学习-【9】异常检测（高斯分布模型）【手抄笔记】

吴恩达机器学习——第16章异常检测

吴恩达机器学习（十五）——异常检测

机器学习笔记（参考吴恩达机器学习视频笔记）14_异常检测

到底谁是异常 (多元高斯分布异常点检测)

监督学习 VS 异常检测算法(含有多元高斯、协方差的概念)

利用高斯分布进行异常检测

吴恩达机器学习笔记之监督学习

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)