【论文学习】ShuffleNet-v1：一种极高效的移动端卷积神经网络

其他 2019-05-14 09:50:59 阅读次数: 0

版权声明： https://blog.csdn.net/DL_wly/article/details/84946264

论文链接：https://arxiv.org/abs/1707.01083

设计思想

卷积神经网络是现代视觉人工智能系统的核心组件。近年来关于卷积模型的研究层出不穷，产生了如 VGG、ResNet、Xception 和 ResNeXt 等性能优异的网络结构，在多个视觉任务上超过了人类水平。然而，这些成功的模型往往伴随着巨大的计算复杂度（数十亿次浮点操作，甚至更多）。这就限制了此类模型只能用于高性能的服务器集群，而对于很多移动端应用（通常最多容许数百万至数千万次浮点操作）则无能为力。

由于现代卷积神经网络的绝大多数计算量集中在卷积操作上，因此高效的卷积层设计是减少网络复杂度的关键。所以轻量级网络应运而生。旷视(Face++)研究院发表的ShuffleNet利用稀疏连接的设计理念，为其中的佼佼者。

作者通过分析已有的卷积模型，发现例如Xception 和 ResNeXt 模型中，逐点卷积的运算量相当可观，成为了新的瓶颈。因此，为了进一步提升模型的速度，就必须寻求更为高效的结构来取代逐点卷积。

创新点

(1) pointwise group convolutions （逐点群卷积）：现有模型中，1x1卷积浪费很多的资源，成为运算的瓶颈，group卷积用来解决这个问题。降低计算复杂度。

Group卷积的缺点：某个通道输出仅从一小部分输入通道中导出，降低了通道组之间的信息流通，降低了信息表示能力。并且，学习到的特征也比较局限。

(2) channel shuffle：通道混洗：消除group卷积带来的副作用

目的：帮助信息流通

示意图

（a）直接进行分组卷积，分组数为g：信息不流通；

（b）（c） channel shuffle示意图；

网络结构

（a）是ResNet中的bottleneck unit，不过将原来的3*3 Conv改成3*3 DWConv；

（b）首先用带group的1*1卷积代替原来的1*1卷积，同时跟一个channel shuffle操作，这个前面也介绍过了。然后是3*3 DWConv表示depthwise separable convolution；

（c）添加了一个Average pooling和设置了stride=2，另外采用concat的操作，也就是按channel合并。

实验结果

主要为分类应用中的实验结果

猜你喜欢

转载自blog.csdn.net/DL_wly/article/details/84946264

【论文学习】ShuffleNet-v1：一种极高效的移动端卷积神经网络

跟着专注于计算机视觉的AndyJ的妈妈我学神经网络ShuffleNet-V1

shuffleNet-V1论文阅读及代码实现

DRU-Net--一种用于医学图像分割的高效深度卷积神经网络

[论文学习]An Effective Approach for Mining Mobile User Habits：一种高效挖掘移动用户习惯的方法

【论文泛读06】学习交通图像：一种用于大规模交通网络速度预测的深度卷积神经网络

卷积神经网络研究综述（周飞燕）论文学习笔记

论文学习记录：基于深度卷积神经网络的超分辨率算法

轻量化卷积神经网络MobileNet论文详解（V1&V2）

论文-MobileNet-V1、ShuffleNet-V1、MobileNet-V2、ShuffleNet-V2、MobileNet-V3

卷积神经网络只是一种全连接神经网络的特殊情况

论文学习-系统评估卷积神经网络各项超参数设计的影响-Systematic evaluation of CNN advances on the ImageNet

[卷积神经网络]基干网络之VGG、ShuffleNet

神经网络2：卷积神经网络学习 1

ShuffleNet V1/V2 | 轻量级深层神经网络

深度学习（1）卷积神经网络

卷积神经网络学习总结（1）

一种用于端到端音频分离的多尺度神经网络

轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络SqueezeNet，MobileNet，ShuffleNet

轻量化卷积神经网络（SqueezeNet，MobileNet，ShuffleNet，Xception）

深度学习【一】卷积神经网络

卷积神经网络学习（一）

改进YOLOv8 | 主干网络篇 | YOLOv8 更换主干网络之 ShuffleNetv2 | 《ShuffleNet v2：高效卷积神经网络架构设计的实用指南》

卷积神经网络——YOLOV1论文翻译

深度学习+EEG：一种采用单通道EEG检测被试注意力状态的卷积神经网络构架

一种用回归神经网络学习说话人嵌入的无监督神经网络预测框架

目标检测论文综述（一）深度卷积神经网络

卷积神经网络-1

论文学习笔记之——基于深度卷积神经网络和跳跃连接的图像去噪和超分辨

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)