Channel Pruning的软化策略——允许更新Pruned Filter - 代码天地

Channel Pruning的软化策略——允许更新Pruned Filter

其他 2018-09-08 20:08:54 阅读次数: 0

"Soft Filter Pruning for Accelerating Deep Convolutional Neural Networks"这篇文章首先强调了结构稀疏的优势，基于结构稀疏的channel pruning不需要特定存储格式和算法库的支持，能够充分利用成熟算法库或框架以运行裁剪后模型。文章同时提到传统的"hard filter pruning"依赖于预训练模型，并且直接删除pruned filters，结果导致模型容量减少、推理精度下降，且需要额外的、相对耗时的fine-tuning过程以恢复损失的精度。

如上图所示，文章为此提出了"soft filter pruning (SFP)"策略，允许模型从随机初始化开始（从预训练模型开始能获得更好的效果），并在每个epoch训练开始之前，将具有较小L2-norm的filters置零，然后更新所有filters（包括未剪枝和已剪枝filter），最终模型收敛以后再把一些不重要的filters（zero-filters）裁剪掉，从而获得模型容量较高、推理精度较高的训练、剪枝结果。显然该策略类似于DSD（Dense-Sparsity-Dense）的训练、剪枝策略，避免了不必要的fine-tuning过程，能够充分利用每个权重连接（无论是未剪枝和已剪枝的连接）的记忆作用，达到理想的正则化效果。

Soft Filter Pruning (SFP)策略如上图所示，主要分为四个步骤：1）filter selection：采用L2-norm以及预先定义的剪枝率P，选择出一些不重要的filters；2）filter pruning：在每个epoch训练开始之前，在全局层面将不重要的filters置零，并允许置零的filters在训练期间接受参数更新（soft-manner，不同于greedy selection），从而更好地平衡每个filter的贡献；3）reconstruction：通过反向传播更新所有filters，能够让pruned model获得与原始模型相同的容量，并允许模型从随机初始化开始训练，避免了不必要的fine-tuning过程；4）obtaining compact model：最终训练收敛以后，通过裁减掉zero filters可以获得结构紧凑的网络模型，同时达到理想的压缩与加速效果；

实验部分，文章在Cifar10、ImageNet2012数据集上对Resnet做了测试，获得了理想的剪枝效果，具体结果见文章。

论文地址：https://www.ijcai.org/proceedings/2018/0309.pdf

GitHub：https://github.com/he-y/soft-filter-pruning

猜你喜欢

转载自blog.csdn.net/nature553863/article/details/81065280

Channel Pruning的软化策略——允许更新Pruned Filter

Channel pruning的衡量准则

通道剪枝Channel Pruning

模型压缩之Channel Pruning

Channel Estimation for High Speed Wireless Systems using Gaussian Particle Filter and Auxiliary Particle Filter

CNN中feature map、卷积核、卷积核个数、filter、channel的概念解释，以及CNN 学习过程中卷积核更新的理解

Channel

Channel Pruning for Accelerating Very Deep Neural Networks

Flume_Flume常用配置5_header + filter taildir.source_memory.channel_hdfs.sink

CVPR2017跟踪算法CSR-DCF的配置（Discriminative Correlation Filter with Channel and Spatial Reliability）

CNN中feature map、卷积核、卷积核的个数、filter、channel的概念解释

Channel Pruning for Accelerating Very Deep Neural Networks 论文笔记

Network Slimming——有效的通道裁剪方法（channel pruning）

《Channel Pruning for Accelerating Very Deep Neural Networks》论文笔记

模型剪枝学习笔记 --- Channel Pruning via Optimal Thresholding

《DMCP：Differentiable Markov Channel Pruning for Neural Networks》论文笔记

人工智能AI基本概念整理 2 feature map、卷积核、卷积核个数、filter、channel的概念解释

filter

$filter

Microsoft Graph Toolkit 更新 - Playground和Microsoft Teams Channel Picker

springboot配置Filter & 允许跨域请求

神经网络后处理：A New HEVC In-Loop Filter Based on Multi-channel Long-Short-term Dependency Residual Network

L1-norm based channel pruning（Pruning Filters for Efficient ConvNets）论文笔记——PRUNING FILTERS FOR EFFICIENT CONVNETS

CVPR2017 论文阅读 Channel Pruning for Accelerating Very Deep Neural Networks

Rethinking the Smaller-Norm-Less-Informative Assumption in Channel Pruning of Convolution Layers论文翻译

Channel Pruning：用于加速深度神经网络的通道剪枝方法

2019-ICCV-MetaPruning Meta Learning for Automatic Neural Network Channel Pruning-论文阅读

【DMCP】2020-CVPR-DMCP Differentiable Markov Channel Pruning for Neural Networks-论文阅读

ThiNet: A Filter Level Pruning Method for Deep Neural Network Compression笔记

DL-paper精读：Learning Filter Pruning Criterion

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)