图特征金字塔网络：目标检测的创新多尺度学习

PDF格式 | 1013KB | 更新于2025-01-16 | 161 浏览量 | 举报

"本文主要介绍了图特征金字塔网络（GraphFPN），这是一种针对目标检测任务的多尺度特征学习方法。GraphFPN通过构建适应性图像特定的超像素层次结构，能够根据图像内在的多尺度结构进行特征交互，从而增强深度卷积神经网络（CNN）的特征金字塔网络（FPN）。它包含上下文层和层次层来实现不同尺度间的特征交互，并通过引入局部通道注意力机制提升图神经网络的性能。实验表明，集成到Faster R-CNN算法中的GraphFPN在MS-COCO2017验证和测试数据集上的对象检测性能优于基于FPN的现有方法和其他流行检测技术。" 在深度学习，特别是计算机视觉领域，多尺度特征学习是解决图像中不同大小目标的关键。传统的FPN通过固定层次的特征融合提供多尺度信息，但无法动态适应图像的特定结构。GraphFPN的创新之处在于它构建了一个动态的图结构，该结构根据输入图像的内在结构自适应地调整。每个图像被划分为特定的超像素，这些超像素构成的层次结构反映了图像的多尺度特性。图特征金字塔网络中的上下文层和层次层设计用于在同一尺度内和不同尺度间进行特征交互，这对于捕捉不同尺度的目标至关重要。此外，通过借鉴CNN的全局通道注意力，GraphFPN引入了两种类型的局部通道注意力机制，使图神经网络更加强大，能够更好地提取和融合特征。在实际应用中，GraphFPN被整合到Faster R-CNN这一经典的目标检测框架中，提升了检测的准确性和效率。实验结果表明，与传统的FPN和如PANet、FPT等改进版本相比，GraphFPN在MS-COCO2017数据集上的表现更优，验证了其在目标检测任务中的有效性。总结来说，图特征金字塔网络（GraphFPN）是一种利用图神经网络改进特征金字塔网络的多尺度特征学习方法，通过自适应图像结构和局部通道注意力，提高了对目标检测任务的理解和处理能力。这一方法为深度学习在目标检测领域的研究提供了新的视角和工具，有助于进一步提升模型的性能和鲁棒性。

展开

2763

†

GraphFPN：用于目标检测的图特征金字塔网络

复旦大学计算机学院星云

组赵刚明

、

、魏峰葛

伟

、

、易舟余

伟

、

上海市智能信息处理

香港大学计算机科学系

摘要

特征金字塔在需要多尺度特征的图像理解任务中已被

证明是强大的。用于多尺度特征学习的最先进方法专

注于使用具有固定拓扑结构的神经网络跨空间和尺度

执行特征交互。在本文中，我们提出了图形特征金字

塔网络，能够适应其拓扑结构，以不同的内在图像结

构，并支持跨所有尺度的同时功能交互。我们首先为

每个输入图像定义一个图像特定的超像素层次结构，

以表示其内在的图像结构。图形特征金字塔网络从该

超像素层级继承其结构。上下文层和层次层旨在实现

同一尺度内和不同尺度间的要素交互。为了使这些层

更强大，我们通过概括卷积神经网络的全局通道注意

力，为图神经网络引入了两种类型的局部通道所提出

的图特征金字塔网络可以增强卷积特征金字塔网络的

多尺度特征。

我们通过将其集成到

Faster R-CNN

算法中，在对象

检测任务改进后的算法不仅优于以前最先进的基于特

征金字塔的方法，而且在

MS-COCO 2017

验证和测试

数据集上也优于其他流行的检测方法。

介绍

深度卷积神经网络利用了局部连通性和权重共享，

并导致了一系列

本文是赵刚明在复旦大学做访问生时完成的。* 通讯作者：

wfge@fudan.edu.cn和y-izhouy@acm.org

计算机视觉任务的突破，包括图像识别[23，46，12，

47]，物体检测[9，41，33，39，

5，30，45]和语义分割[32，54，28，17，52，48]。

由于图像中的对象可能具有不同的尺度，因此非常希

望获得多尺度特征图，该多尺度特征图在每个不同尺

度下融合了具有足够空间分辨率的高级和低级特征这

激发了特征金字塔网络（FPN [29]）及其改进版本，

如路径聚合网络（ PANet [32] ）和特征金字塔

Transformer（FPT [52]）以及其他方法[21，18，8，

50，11]。

每一幅图像都具有多尺度的内在结构，包括将像素

分组为对象部分、将部分进一步分组为对象以及对象

在图像空间中的空间布局这种多尺度的内在结构在不

同的图像中是不同的，可以为图像理解和目标识别提

供重要的线索。但是FPN及其相关方法总是使用固定的

多尺度网络拓扑（即，神经元的2D网格）。这种固定

的网络拓扑对于多尺度特征学习可能不是最佳的根据

心理学证据[13]，人类将视觉场景解析成部分-整体层

次结构，并动态地在不同图像中建模部分-整体关系受

此启发，研究人员开发了一系列分层分割可以根据超

像素的位置和相似性递归地对超像素进行分组，以生

成超像素层级[38，34]。这种部分-整体层次结构可以

通过弥合像素和对象之间的语义差距来辅助对象检测

和语义分割[34]。

众所周知，除了同一尺度内的相互作用之外，特征

金字塔中的多尺度特征还可以通过跨尺度相互作用

[29，32，25，52]来增强。与特征金字塔网络相关的

现有方法的另一个限制是，只有来自相邻尺度的特征

直接交互，而来自非相邻尺度的特征在-

下载后可阅读完整内容，剩余9页未读，立即下载

身份认证购VIP最低享 7 折!

30元优惠券

cpongm

粉丝: 6

图特征金字塔网络：目标检测的创新多尺度学习

多尺度选择金字塔网络的小样本目标检测算法.docx

FPN:用于目标检测的特征金字塔网络

基于特征金字塔网络的运动目标检测算法

YOLO目标检测特征金字塔网络：构建多尺度特征，提升检测性能

用于目标检测的多尺度HOG功能

全光特征金字塔网络：语义与实例分割的统一基线方法

特征金字塔变压器：实现跨空间和尺度的功能交互

深度学习目标检测中的特征金字塔网络

金字塔卷积：提升目标检测性能的新方法

特征金字塔网络增强的小目标检测算法

最新资源