异常检测学习笔记 一、异常检测及基本统计

一、什么是异常?

1、异常的定义

        异常是指与其他数据有很大不同的数据。异常现象是“一种与其他观测结果大相径庭的观测结果,以至于人们怀疑它是由不同的机制产生的。”,也被称为“异常”或“离经叛道”。

        所有观测值 = 正常数据 + 异常值

        异常值 = 噪声 + 异常

        噪声 = 人们不感兴趣的异常值

        异常 = 人们关心的的异常值

离群点

2、两个基本问题

        1、要将一个点归类为异常,偏差必须有多大?没有明确的答案。在一定程度上取决于主观判断。

        2、如何将异常与噪声区分开来?这取决于你更关心什么。

白色的蛋算是异常吗?

3、异常类型

        1、点异常:与其他数据相比,单个数据点似乎很奇怪。示例:一次异常大额的

猜你喜欢

转载自blog.csdn.net/bashendixie5/article/details/131037851