FCN全卷积网络理解

FCN我以前总是把它很1*1 conv弄混,实际上这是两个不同的概念,FCN意思是把FC层用卷积层替代,用于处理segmentation问题的一个网络;1*1是一种卷积形式,用于改变feature map的channel

理解FCN的过程中我参考了这个博客的介绍:

博客1:https://www.cnblogs.com/gujianhan/p/6030639.html

虽然点赞很多,但是我仍有疑惑,并有不同的想法。

首先建议参读原文https://people.eecs.berkeley.edu/~jonlong/long_shelhamer_fcn.pdf,这是最权威的FCN解释。

1. FCN是用来解决segmentation问题的,传统的网络是用滑动窗口的方法在每个像素点周围进行滑动,如一个15*15的滑动窗口,送进传统的卷积池化全连接层,得到这个像素点的类别。这一点在博客1有解释:

我的理解是一张100*100的原图,,用传统方法做segmentation,需要让100*100=10000个滑动窗口通过传统CNN网络,这样确实很低效。

于是FCN提出替换全连接层的方法,也是博客1的解释:

意思是说不用滑动窗口多次评价,直接在原图上做卷积,得到一个6*6的feature map(通道数为预测类别数),效果是一样的。6*6的feature map再通过上采样,变成原图尺寸,这时每个像素点的label就有了。

扫描二维码关注公众号,回复: 5906907 查看本文章

2. FCN相比传统CNN的优势:

个人认为有两个,如果其他优势欢迎告知谢谢:

1. 在做segmentation任务的时候可以提高效率

2. 在做classification任务的时候可以接受任意尺寸大小的图片输入。博客一中的解释让我疑惑很久,让人觉得好像segmentation任务用传统CNN来做只能接受固定大小的图片输入,但是我觉得传统CNN做segmentation用什么尺寸的图片都可以,只要滑动窗口尺寸不变就行。做classification任务的时候传统CNN之所以不接受任意尺寸大小的图片输入是因为有全连接层,而FCN没有这个问题是因为它可以直接在整张图片上做卷积。(见原文解释如下图2)对原文这里也有些疑惑,卷积核的大小不是仍然不是固定的吗?怎么可以接受任意尺寸大小的图片输入呢?反正我写训练前都是要把图片resize成统一大小的。

如有其它合理解释欢迎交流,谢谢

猜你喜欢

转载自blog.csdn.net/scut_salmon/article/details/89228780