持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第6天,点击查看活动详情
Hello,非常感谢你的关注~ 我是机器学习与风控,一名末流985的本硕,无顶会、无大厂核心部门实习,拥有多个比赛的竞赛经历,秋招刷了leetcode500题,在秋招提前批中收获字节跳动,腾讯,阿里,美团等大厂offer,最终选择入职字节风控,从事与黑产对抗的工作。我会定期分享我的春招、秋招亲身求职体验;算法岗日常工作;数据挖掘比赛,经典图模型等日常学习等有料也有趣的内容~秋招到了,欢迎各位私信找我内推!
2.1节介绍的图异常检测技术将表示学习和异常检测任务分成了两个独立的步
骤进行训练,本节将对基于联合学习的图异常检测方法进行详细介绍。
在基于深度学习的图异常检测场景下,由于标签数据难以获得[43],仅根据数
据实例的内在属性来检测离群值的无监督深度异常检测技术有了广泛研究。此外,
通常还可以访问一小部分如领域专家标记的样本,因此半监督的学习也常用于异
常检测。目前具有代表性的基于深度学习的图异常检测方法如表2.1所示,接下来
本小节将从无监督和半监督的角度下对基于深度学习的异常检测方法进行介绍。 目前已有的深度学习的无监督的图异常检测方法[44–46, 46, 48] 大都采用残
差分析的思想,该类方法将原始数据与估计数据的差距(即重构误差) 作为数据集
中实例异常的有力指标。深度自编码器是所有无监督的深度图异常检测模型的核
心,其思想是假定正常的实例数目比异常实例多,深度自编码器可以记住正常的
模式,但不能有效地从低维投影重建这些异常点,因此这些较少出现的异常点在
通过自编码器后往往具有较大的残差,从而被判别为异常点。该类模型的框架如
图2.5所示,输入数据通过一个编码器(Encoder) 得到数据的隐层表示,然后该表示
通过一个解码器(Decoder) 重构输入数据,最后用输入和重构的输出之间的残差损
失(Residual Loss) 大小作为衡量数据异常的指标。
在基于残差分析思想的基础上,学者们提出了一系列图上无监督的异常检测
方法。首先,在早期的工作[44] 中,作者针对在没有先验知识的情况下,如何利用
属性残差和网络信息之间的一致性,从而以一般方式识别异常,提出了异常检测
框架Radar,进而进行异常检测任务,通过分析残差,发现与大多数样本不同的异
常行为。