一、本文介绍
本文给大家带来的改进机制是ModulatedDeformConv来替换我们模型的下采样操作,同时含二次创新C3k2机制,其主要思想是通过引入可学习的空间偏移量,实现感受野的动态调整,增强卷积神经网络对图像中几何变换的适应能力。不同于其它的Conv这种可变形Conv主要就是通过学习下采样的位置来进行提高检测精度,但是这种方法可以减少计算量,网络层数,所以这个方法还是比较推荐大家在自己数据集上尝试一下的,能够减少网络层数的机制不多。
欢迎大家订阅我的专栏一起学习YOLO!
训练信息1:YOLO11-C3k2-MDConv-1 summary: 315 layers, 2,616,209 parameters, 2,616,193 gradients, 6.4 GFLOPs |
训练信息2:YOLO11-C3k2-MDConv-2 summary: 314 layers, 2,668,612 parameters, 2,668,596 gradients, 6.4 GFLOPs |
训练信息3:YOLO11-MDConv summary: 313 layers, 2,718,804 parameters, 2,718,788 gradients, 5.4 GFLOPs |
基础版本:YOLO11 summary: 319 layers, 2,591,010 parameters, 2,590,994 gradients, 6.4 GFLOPs |
目录