卷积优化

其他 2019-04-22 15:01:10 阅读次数: 0

本文章仅记录卷积优化原理

以下来自转载

转载地址:[link]http://shuokay.com/2018/02/21/winograd/

首先要明确一点, 这里说的卷积是是指 ConvNet 中默认的卷积, 而不是数学意义上的卷积. 其实, ConvNet 中的卷积对于与数学中的 cross correlation.
计算卷积的方法有很多种, 常见的有以下几种方法:
滑窗: 这种方法是最直观最简单的方法. 但是, 该方法不容易实现大规模加速, 因此, 通常情况下不采用这种方法 (但是也不是绝对不会用, 在一些特定的条件下该方法反而是最高效的.)
im2col: 目前几乎所有的主流计算框架包括 Caffe, MXNet 等都实现了该方法. 该方法把整个卷积过程转化成了 GEMM 过程, 而 GEMM 在各种 BLAS 库中都是被极致优化的, 一般来说, 速度较快.
FFT: 傅里叶变换和快速傅里叶变化是在经典图像处理里面经常使用的计算方法, 但是, 在 ConvNet 中通常不采用, 主要是因为在 ConvNet 中的卷积模板通常都比较小, 例如 3×3 等, 这种情况下, FFT 的时间开销反而更大.
Winograd: Winograd 是存在已久最近被重新发现的方法, 在大部分场景中, Winograd 方法都显示和较大的优势, 目前 cudnn 中计算卷积就使用了该方法.

有时间的话，详细分析以下四个实现

ReferenceConvFunctor是按部就班的计算卷积实现
Im2ColConvFunctor里面是将kernel平铺，input平铺，然后利用gemm或者eigen做矩阵运算实现
fft实现卷积是利用时间域的卷积等于频域的相乘，做fft和ifft，以及相乘实现起来应该也不复杂的
参考[link]https://blog.csdn.net/xienaoban/article/details/69486299
winograd介绍是说更多的加法来减少乘法，来达到优化的目的
参考[link]https://blog.csdn.net/dengdengma520/article/details/80541598

GEMM neon矩阵优化

参考[link]https://www.jianshu.com/p/68879baa7c1f

奇异递归模板模式

参考[link]https://blog.csdn.net/daniel_ustc/article/details/73699378
参考[link]https://blog.csdn.net/daniel_ustc/article/details/74857956

猜你喜欢

转载自blog.csdn.net/weixin_31614117/article/details/88202167

傅里叶变换到卷积定理

卷积码

翻译 | 卷积码的维特比（Viterbi）译码

4.3.2 信道编码 ——卷积码

卷积码的维特比（Viterbi）译码

“斗气化翼”——初识卷积码

【信号与系统学习笔记】—— 连续时间非周期信号傅里叶变换的性质【下篇】（时域卷积定理和频域卷积定理）

数字图像处理中的卷积定理和傅里叶变换

卷积优化

有关傅里叶变换、拉普拉斯变换、数字图像处理的卷积与卷积定理

【编译原理】中间代码优化(二) 局部优化

【编码】关于卷积码的学习笔记（三）

【编码】关于卷积码的学习笔记（二）

【编码】关于卷积码的学习笔记（一）

通信原理--信道编码--卷积码--Viterbi译码

通信原理--信道编码--卷积码

卷积码编码器的结构与表示

图形学笔记（六）光栅化2 —— Artifacts、时域与频域、滤波、卷积定理、超采样、MSAA、深度缓存

慕课编译原理(第二十三章.局部优化-基本块优化)

【数学】C039_给定数字能组成的最大时间（暴力枚举 | 局部优化）

慕课编译原理(第二十三章.局部优化-基本块划分)

卷积操作的HLS优化

如何优化图像卷积

离散信号（四）| 周期信号 |离散傅里叶级数（DFS）推导 + 主要性质（周期卷积定理、帕斯瓦尔定理）

卷积码Viterbi译码算法基本原理及C语言实现

移动通信——基于卷积码的差错控制系统仿真模型

卷积神经网络的优化

【OFDM】AWGN 信道下 BPSK 调制 (卷积码) 性能对比仿真实验 (Matlab 实现)

(2,1,3)卷积码与一种QC-LDPC码的译码性能对比

伪随机交织抑制突发噪声的MATLAB仿真（采用(2,1,3)卷积码）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)