深度学习中图像预处理为什么要减去图像均值

   在深度学习中,大家都会发现训练集,验证集合测试集划分好之后会有减去均值的一步操作,但很多人都是只跟着做,并没有探究为什么要做这一步处理。

   其主要原理是我们默认自然图像是一类平稳的数据分布(即数据每一维的统计都服从相同分布),此时,在每个样本上减去数据的统计平均值可以移除共同的部分,凸显个体差异。其效果如下所示:
                                       
                                         在这里插入图片描述

   可以看到天空的纹理被移除了,凸显了汽车和高楼等主要特征。

   最值得注意的一点是,在计算均值之前就要预先划分好训练集验证集和测试集,然后只针对训练集计算均值,否则就违背了深度学习的原则:模型训练过程仅能从训练模型中获取信息。得到训练集的均值后,对训练集验证集和测试集分别减去该均值。

参考:
1、深度学习历程之图片的预处理为什么要减去图片的平均值(这篇写得很详细,从主成分和方向传播的角度分析)
2、【数据预处理】:图像去均值:image mean 和 pixel mean

发布了62 篇原创文章 · 获赞 83 · 访问量 3万+

猜你喜欢

转载自blog.csdn.net/zhou4411781/article/details/101205535