注意:这是我对这篇文章的一些理解,带有严重的私货,仅供参考,非对文章的简单翻译。
ABSTRACT
文章的出发点
针对deep-learning system的广泛应用,特别是安全领域(自动驾驶)方面的应用,不仅仅需要deep-learning system的高准确率,还需要考虑的是正确性和准确性以避免corner case所带来的重大危害。而且现在的deep-learning system严重依赖人工输入的数据训练,无法找出其中蕴含的脏数据,这可能带来
文章的内容
文章作者针对上述情况,需要对deep-learning system 的覆盖率(文章中并没有这个概念,这是我提的),作者提出Deepxplore的方法。
- 先提出neuron coverage(神经元覆盖率),
- 利用多交叉系统交叉验证,以避免人工检测
- 我们寄希望所测出的deep-learning system,所具有的特质是,
文章所想达到的目的
有效的找到非正确数据,对抗性样本(adversial sample),肉眼无法分辨,但是能够误导deep-learning system ,使之产生错误,在提出对抗性样本(Intriguing properties of neural networks一文)中,提出其一是神经网络中包含语义信息的部分并不是在每个独立的神经元,而是整个空间;其二是神经网络学习到的从输入到输出的映射在很大程度上是不连续的。其中第二条特性,表示可以对样本增加肉眼无法识别的扰动,欺骗深度学习系统 。所以可以用来作为清洗脏数据。