一、本文介绍
本文记录的是利用焦点调制模块Focal Modulation改进YOLOv11的方法研究。Focal Modulation
利用深度可分离卷积层
实现的焦点语境化来编码从短到长范围的视觉语境,通过门控聚合
有选择性地为每个查询标记收集语境到调制器中,并利用逐元素仿射变换
将调制器注入查询,优化了对视觉任务中标记交互的建模能力,提高模型性能。
专栏目录:YOLOv11改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进