全局特征金字塔网络(GFPN)在信息融合中的应用提升检测精度

需积分: 32 2 下载量 15 浏览量 更新于2024-08-06 收藏 3.38MB PDF 举报
"特征不平衡问题是影响神经网络检测效率的关键因素,文中提出了一种基于全局特征金字塔网络(GFPN)的信息融合方法,用于解决Mask R-CNN中的特征不平衡问题。该方法通过融合GFPN生成的不同尺度特征,构建包含全局语义信息的特征网络,并对原始特征层进行反向过程的重标度,使每个特征层都具备全局语义信息。实验结果显示,这种方法在提升检测精度4-6个百分点的同时,仅增加了0.112s的检测时间。" 文章探讨了神经网络,特别是Mask R-CNN模型中普遍存在的特征不平衡问题。这个问题会导致模型的检测效率下降,影响其性能。为了解决这一问题,作者提出了全局特征金字塔网络(Global Feature Pyramid Network, GFPN)的信息融合策略。GFPN是一种多尺度特征提取结构,能够从不同层次捕获图像的细节和全局上下文信息。 在Mask R-CNN框架中,通常存在高层特征具有较强的语义信息,但空间分辨率较低,而低层特征则相反,它们拥有较高的空间分辨率但语义信息较弱。这种特征不平衡可能导致关键信息的丢失或不充分的利用。GFPN通过融合不同层级、不同大小的特征图,旨在弥合这一鸿沟,创建一个包含了从局部到全局的丰富语义信息的特征网络。 信息融合方法的具体实现包括两个主要步骤:首先,GFPN生成不同尺度的特征,这些特征包含了不同级别的细节和语义理解;然后,通过一个反向过程,对原始特征层进行重新标度,确保所有层都携带了全局语义信息。这样的设计使得模型在处理复杂场景时,各个特征层都能有效地参与决策,提高整体的检测准确性和鲁棒性。 实验结果证明,应用GFPN信息融合方法后的Mask R-CNN模型在目标检测的精度上有了显著提升,达到了4-6个百分点的增长。同时,检测时间仅增加了0.112秒,这表明该方法在提高性能的同时,对计算效率的影响较小,具有实际应用的价值。 关键词:特征不平衡、全局特征金字塔网络、语义信息、Mask R-CNN、深度学习。这项工作展示了在深度学习模型优化中,通过改进特征融合策略可以有效地应对特定问题,提高模型的效能,对于后续的计算机视觉研究和应用有着重要的参考价值。