GraphR-CNN: 基于图的高效场景图生成与关系处理

165 浏览量更新于2024-06-20 收藏 1.23MB PDF 举报

本文主要探讨了"基于图的场景表示及生成方法"，由Jianwei Yang等人提出，他们针对场景图生成这一前沿问题，设计了一种创新模型——Graph-R-CNN。Graph-R-CNN在图像理解中实现了高效且精确的对象检测和关系识别，特别强调了处理图像中对象间潜在关系的能力。文章的核心组成部分包括： 1. 关系建议网络（RePN）：作为模型的关键组件，RePN旨在有效地处理图像中对象之间关系的复杂性。通过设计一个针对潜在关系的网络架构，它能够在对象数量增多时保持高效性，避免了全连接图带来的扩展性问题。 2. 注意力图卷积网络（aGCN）：这个模块用于捕捉对象和关系之间的上下文信息，通过注意力机制，模型能够聚焦于与当前任务相关的部分，提高图表示的精准度和语义理解能力。 3. 场景图生成：Graph-R-CNN的目标是从图像中生成结构化的场景图，包含对象、属性以及它们之间的关系，这对于支持高级视觉智能任务如视觉问答和图像字幕生成具有重要意义。 4. 评估指标：文中提出了一个新的评价指标，相较于现有标准，它更全面且符合现实场景，旨在提供更准确的模型性能评估。作者报告了使用现有和新指标进行的最先进的场景图生成性能。整体而言，这篇文章在场景图生成领域做出了重要的贡献，不仅提升了模型的性能，还引入了新的思考角度和评估方式，为后续研究提供了有价值的基础和方向。通过结合关系建议网络和注意力图卷积网络，Graph-R-CNN展示了在处理大规模场景理解和生成任务上的潜力。

Yang和Lu等

- 一个用于对象，一个用于关系-并执行消息传递

。类似地，在[17]中，作者提出

了两种用于在对象和关系之间传播信息的消息传递策略（并行和顺

序）。 Dai等人[2]将场景图生成过程建模为条件随机场（CRF）上的推

理。Newell等人[26]提出了直接从图像像素生成场景图，而不使用基于关

联图嵌入的对象检测器。在我们的工作中，我们开发了一种新的注意力

图卷积网络（aGCN），通过在候选场景图中的节点之间传播上下文来更

新节点和关系表示

-操作视觉和语义特征

。虽然在功能上类似于上述基于消

息传递的方法，但aGCN是高效的，并且可以学习将注意力放在可靠的边

缘上并抑制不太可能的边缘的影响

许多以前的方法已经注意到场景图生成的强烈规律在[23]中，Lu

.集成来自语言的语义先验以改进对象之间同样，Li

et al

.[18]证明了

区域字幕也可以为场景图生成提供有用的上下文。与我们的动机最相

关的是泽勒

等

。[42]形式化基序的概念（

例如

，定期发生的图形结

构），并检查其在Visual Genome数据集中的流行率[14]。作者还提出

了一个令人惊讶的强大的基线，直接使用频率先验来预测关系-

关系提案。我们的关系建议网络（RePN）受到启发，并且与用于对

象检测的更快R-CNN [32]的区域建议网络（RPN）密切相关。我们的

RePN在精神上也类似于最近提出的关系提案网络（Rel-PN）[45]。这

些方法之间有许多细微的差别Rel-PN模型独立地预测针对主语、宾语

和谓语的提议，然后对所有有效的三元组重新评分，而我们的RePN

生成以对象为条件的关系，允许其学习对象对关系偏差。此外，他们

的方法是类不可知的，并没有被用于场景图生成。

图卷积网络（GCN）。GCN首先在[13]中在半监督学习的背景GCN将

图数据上的复杂计算分解为每个时间步长处的每个节点的一系列局部

化操作（通常仅涉及相邻节点）结构和边缘强度通常在计算之前是固

定的。为了完整性，我们注意到即将出版的出版物[36]同时独立开发

了类似的GCN注意力机制（如aGCN），并在其他（非计算机视觉）

环境中显示了其有效性。

方法

在这项工作中，我们模型场景图的图形组成的图像区域，rela- tionships，

和他们的标签。更正式地说，让I表示一个图像，V是一个集合

剩余15页未读，继续阅读

cpongm

粉丝: 6

GraphR-CNN: 基于图的高效场景图生成与关系处理

基于场景的测试模型生成方法：FSM与UML图示应用

基于双重注意力机制的遥感图像场景分类特征表示方法.docx

场景图字幕：基于结构视觉表示的图像字幕

083基于拉丁超立方法的风光场景生成与削减.zip

面向决策规划系统测试的具体场景自动化生成方法.pdf

基于深度卷积特征的场景全局与局部表示方法.docx

无监督场景图对齐的图像字幕生成方法

预期预训练：动态场景图生成的创新方法及实验

PPDL: 解决长尾偏差的无偏场景图生成方法

结构视觉表示的图像字幕生成：场景图_captioner框架

最新资源