YOLOv4-MA: 混合注意力机制提升小目标检测精度

需积分: 0 2 下载量 44 浏览量 更新于2024-06-26 2 收藏 5.39MB PDF 举报
"基于YOLOv4的多场景小目标检测" 本文主要探讨了在目标检测领域中的一个重要问题——小目标检测,并提出了一个基于YOLOv4的改进算法,名为YOLOv4-MA(YOLOv4 with Mixed Attention)。YOLOv4-MA通过引入混合注意力网络(Mixed Attention Network, MA)来增强小目标的特征表示,从而解决小目标检测中的漏检和误检问题。 小目标检测在诸多领域如行人识别、人脸识别等具有重要应用,但因其特征弱、样本分布不均等问题,现有算法往往表现不佳。为提高小目标检测的准确性,本文首先分析了小目标检测的挑战和相关研究背景,然后提出了混合注意力网络MA。MA结合了空间注意力和通道注意力机制,强化了小目标在特征图中的权重,增强了模型对小目标的识别能力。 此外,为了提升模型的鲁棒性与检测精度,文章在训练阶段采用了优化版的Mosaic数据增强策略,并利用KMeans++算法对小目标数据集进行了二次聚类。这样的预处理步骤有助于模型更好地学习小目标的特征,减少样本不平衡的影响。 在特征融合方面,YOLOv4-MA在网络的“颈部”部分增加了双反卷积模块(Double Deconvolution Module, DDM),以提高语义信息的融合能力,这有助于捕捉到更多的上下文信息,尤其对于小目标的定位有显著提升。 最后,为了缓解小目标检测中可能遇到的梯度消失或爆炸问题,YOLOv4-MA使用了聚焦且高效的交并比损失函数(Focal and Efficient Intersection Over Union, Focal-EIOU),以取代传统的完全交并比损失函数(Complete Intersection Over Union, CIOU)。Focal-EIOU损失函数的设计有助于模型在训练过程中更加关注难以检测的小目标,提高其检测性能。 YOLOv4-MA通过一系列创新性的改进,如混合注意力网络、优化的数据增强和损失函数,有效地提升了多场景小目标检测的准确性和稳定性,为小目标检测领域提供了一种有力的解决方案。