机器学习笔记7——异常检测（Anomaly Detection） - 代码天地

机器学习笔记7——异常检测（Anomaly Detection）

其他 2018-07-08 05:09:15 阅读次数: 0

前言：这是机器学习算法的一个应用，主要用于无监督学习。

一、定义

已知有了一些数据，，新来一个数据，需要判断这个数据是否异常。

给定无标签数据集，对数据建模为P(x)，x为特征变量。如果,就是阈值，那么就认为这是异常。

二、利用高斯分布进行异常检测（样本都无标记）

1、条件

每个数据有n个特征，可以理解为n维，每个特征都服从自己的高斯分布。

2、总结步骤

三、算法评估（有些样本有标记）

3.1 要求

通常训练集是无标签的，然后用交叉验证集合测试集来评估异常检测算法，假设这两个集合包含了一些已知异常的样本。

3.2 步骤

（1）已知有很多个正常的样本比如10000个吧和2-50个异常的样本这里就20个吧，需要把它们分成训练集，验证集合测试集。

训练集：6000个正常样本(标签为y=0)

验证集：2000个正常样本(标签为y=0)和10个异常样本（y=1）

测试集：2000个正常样本(y=0)和10个异常样本（y=1）

（2）用训练集来计算

（3）步骤

四、异常检测与监督学习

4.1、使用异常检测的情况

（1）y=1很少，一般0——20个

（2）y=0很多

4.2、使用监督学习的情况

（1）正样本，负样本都很多

（2）正样本数量多到算法可以了解正样本大概什么样子

五、异常检测特征的选择

5.1 如果一个特征的分布不像高斯分布，可以先对这个特征取对数，然后会发现取对数之后变得像高斯分布了

5.2 当正常样本混入一个异常样本时，就启发我们维度太低了，需要增加特征，那么就再增加一个特征，如图：

六、多变量高斯分布

6.1 定义

协等高线分布方差矩阵会改变特征的分布形状的高度，方向，宽窄

均值会改变顶峰的位置

（可以参考GPR的联合高斯分布）

概率密度函数为

6.3 原始模型与多变量高斯分布

一般原始模型应用比较多

这是观看吴恩达网易云机器学习系列做的笔记

图片来源于视频课件

猜你喜欢

转载自blog.csdn.net/qq_40597317/article/details/80953667

机器学习笔记7——异常检测（Anomaly Detection）

机器学习笔记——异常检测（anomaly detection）

异常检测（anomaly detection）

异常检测(Anomaly Detection)

Anomaly detection(异常检测)

机器学习算法之------异常检测 Anomaly Detection

【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 15—Anomaly Detection异常检测

吴恩达机器学习课程笔记+代码实现(24)15.异常检测(Anomaly Detection)

异常检测(Anomaly Detection)导论

异常检测(Anomaly Detection)技术

机器学习笔记 ---- Anomaly Detection & Recommendation Systems

吴恩达机器学习之异常检测(Anomaly Detection)（四）：选择特征（详细笔记，建议收藏，已有专栏）

吴恩达机器学习之异常检测(Anomaly Detection)（三）：选择特征（详细笔记，建议收藏，已有专栏）

吴恩达机器学习作业8（上）--- Anomaly Detection（异常检测）

anomaly detection学习笔记（自用）

李宏毅深度学习笔记（十）Anomaly Detection（异常检测）

吴恩达机器学习之异常检测(Anomaly Detection)（一）：问题的动机、高斯分布（详细笔记，建议收藏，已有专栏）

吴恩达机器学习之异常检测(Anomaly Detection)（二）：算法、开发和评价一个异常检测系统、异常检测与监督学习对比（详细笔记，建议收藏，已有专栏）

Anomaly Detection

李宏毅机器学习作业8-异常检测（Anomaly Detection）， autoencoder，残差网络

python数据分析：异常检测分析（Anomaly detection analysis）

异常检测：Towards Total Recall in Industrial Anomaly Detection

【GNN+异常检测】Deep Anomaly Detection on Attributed Networks

论文翻译：Deep Learning for Anomaly Detection: A Review，异常检测的深度学习:回顾

非监督学习之异常检测(Anomaly Detection)算法详解

coursera机器学习公开课笔记15: anomaly-detection

【视频异常检测-论文阅读】Synthetic Temporal Anomaly Guided End-to-End Video Anomaly Detection

Log Anomaly Detection

【论文阅读】Neural Transformation Learning for Deep Anomaly Detection Beyond Images 异常检测，可学习变换，时间序列，表格数据

Future Frame Prediction for Anomaly Detection 代码学习

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)