YOLOV8改进:CVPR 2023 | 在C2f模块不同位置添加EMA注意力机制,有效涨点

1.该文章属于YOLOV5/YOLOV7/YOLOV8改进专栏,包含大量的改进方式,主要以2023年的最新文章和2022年的文章提出改进方式。
2.提供更加详细的改进方法,如将注意力机制添加到网络的不同位置,便于做实验,也可以当做论文的创新点。
2.涨点效果:添加EMA注意力机制,有效涨点。

01e742e4e0ea42ca813d97c02cce2a3d.png

显著的渠道或空间有效性注意力产生机制更加可辨特征表示用各种计算机进行了说明视觉任务。然而,跨通道建模关系与通道降维可能在提取深度视觉表征时带来副作用。本文提出了一种新的高效多尺度注意力(EMA)方法。模块提出。专注于保留信息每个通道上,并减少计算在上方,我们将部分通道重塑为批处理尺寸并将通道尺寸分组为多个子特征构成空间语义特性在每个特性组中分布良好。具体来说,除了将全局信息编码到重新校准每个平行通道的权重支路,两个并联支路的输出特征为的跨维度交互进一步聚合捕获像素级成对关系。我们的行为广泛的消融研究和图像实验分类和目标检测任务很受欢迎基准测试(例如CIFAR-100, ImageNet-1k, MS COCO)和VisDrone2019),以评估其性能。代码网址:https://github.com/YOLOonMe/EMAattention-module

随着深度卷积神经网络(cnn)的发展,越来越多的网络拓扑被用于图像分类和目标检测任务领域。当我们将cnn扩展到多个卷积层时,它表现出显著的增强学习特征表示的能力。然而,它会导致堆栈更多的深度卷积副本,并且需要消耗大量的内存和计算资源,这是构建深度cnn的主要缺点[1],[2]。

猜你喜欢

转载自blog.csdn.net/m0_51530640/article/details/131412297