【傻瓜攻略】深入学习入门之卷积层以及大体框架(一)

呐,作者从今年刚开始学习机器学习,深度学习这方面……写个博客希望在一起学习的朋友们可以相互交流指正……

博客内容浅显,也可能存在错误,如果有bug希望大神们能批评指正。

话不多说,下面开始放干货!可怜

1、神经网络的大体架构


上面是一张关于vgg19的结构图,以此,为例,神经网络大致可以包括(不正经的傻瓜总结,跟书上不太一样):输入层,卷积层,池化层,激活函数,优化器,分类器,学习速率,损失函数。可能和书上的不太一样,但是上述这些是作者总结的关于神经网络最需要关注的。conv是卷积层,pool是池化层,fc为全连接层。大抵网络都是长上述这样,只是卷积层的大小,池化层等等略微变动。下面开始解释各类名词,以及作用吐舌头

2、卷积层 conv <---记住这个单词,很多时候大神们写博客就直接忽略了中文名。这样以后看大神的博客就轻松了,特别是英文的文章这种微笑

参考博客:https://blog.csdn.net/l691899397/article/details/52240421 感谢小姐姐or小哥哥的无私奉献

诺,这就是卷积的计算过程。

上述这个链接的博客,关于卷积的过程写的很详细,再次感谢小姐姐or小哥哥的无私奉献

参考博客:https://www.cnblogs.com/zf-blog/p/6075286.html 感谢小姐姐or小哥哥的无私奉献

扫描二维码关注公众号,回复: 1508469 查看本文章

这篇博客里面说明了卷积层的作用:我们通常会使用多层卷积层来得到更深层次的特征图


上一张关于输出输入数据大小的图:

F=3 => zero pad with 1

F=5 => zero pad with 2

F=7=> zero pad with 3,边界宽度是一个经验值,加上zero pad这一项是为了使输入图像和卷积后的特征图具有相同的维度,如:

输入为5*5*3,filter为3*3*3,在zero pad 为1,则加上zero pad后的输入图像为7*7*3,则卷积后的特征图大小为5*5*1((7-3)/1+1),与输入图像一样;



想必上述 两个博客已经使得小萌新们明白了卷积的计算过程。

参考知乎:https://www.zhihu.com/question/39022858

其实总结来说,可以从模板匹配的方面开始推导。我们可以知道,模板匹配的原理就是数据点乘模板,得到超过阈值的值的地方就是存在这个匹配对象的位置。

同样的,神经网络就是,多次跌代,找到一个合适的权重值组,也就是模板,可以用来判断是不是这个物体。

综上的卷积层的作用,简单来说,就是(另一种模板匹配)。

猜你喜欢

转载自blog.csdn.net/lyy_sha/article/details/80265220
今日推荐