YOLOv11改进 | Conv/卷积篇 | 利用ModulatedDeformConv二次创新C3k2(降低网络层数 + 计算量)

一、本文介绍

本文给大家带来的改进机制是ModulatedDeformConv来替换我们模型的下采样操作,同时含二次创新C3k2机制,其主要思想是通过引入可学习的空间偏移量,实现感受野的动态调整,增强卷积神经网络对图像中几何变换的适应能力。不同于其它的Conv这种可变形Conv主要就是通过学习下采样的位置来进行提高检测精度,但是这种方法可以减少计算量,网络层数所以这个方法还是比较推荐大家在自己数据集上尝试一下的,能够减少网络层数的机制不多。

欢迎大家订阅我的专栏一起学习YOLO!    

训练信息1:YOLO11-C3k2-MDConv-1 summary: 315 layers, 2,616,209 parameters, 2,616,193 gradients, 6.4 GFLOPs
训练信息2:YOLO11-C3k2-MDConv-2 summary: 314 layers, 2,668,612 parameters, 2,668,596 gradients, 6.4 GFLOPs
训练信息3:YOLO11-MDConv summary: 313 layers, 2,718,804 parameters, 2,718,788 gradients, 5.4 GFLOPs
基础版本:YOLO11 summary: 319 layers, 2,591,010 parameters, 2,590,994 gradients, 6.4 GFLOPs

专栏回顾:YOLOv11改进系列专栏——本专栏持续复习各种顶会内容——科研必备


目录

一、本文介绍

二、原理介绍

三、核心代码 

四、手把手教你添加本文机制 

4.1 修改一

4.2 修改二 

4.3 修改三 

4.4 修改四 

五、正式训练

5.1 yaml文件1