图解析神经网络在人-物交互识别中的应用

16 浏览量更新于2024-06-19 收藏 2.83MB PDF 举报

"基于图解析神经网络的人-物交互学习" 本文深入探讨了如何利用图解析神经网络（Graph Parsing Neural Network, GPNN）来实现人-物交互（Human-Object Interaction, HOI）的学习和识别。HOI识别是一项重要的计算机视觉任务，旨在理解图像或视频中人物与物体之间的具体交互行为，如“骑行自行车”或“拿刀切水果”。传统的视觉识别任务如人体姿态估计和物体检测主要关注单个实例，而HOI识别则需要更深层次的语义理解。 GPNN是一种新颖的框架，它将结构知识与端到端的可区分性相结合，用于处理复杂的图像解析问题。在给定的场景中，GPNN能够推断出一个解析图，该图包含两个关键部分：一是用邻接矩阵表示的HOI图结构，二是节点标签，这些标签对应于图像中的个体（人或物）和它们的交互状态。通过消息传递推理机制，GPNN迭代地更新邻接矩阵和节点标签，从而逐步揭示出人与物之间交互的细节。在消息传递框架下，每个节点（人或物）都会根据其邻居节点的信息更新自身的状态。这一过程允许网络捕获上下文信息并处理复杂的相互作用。GPNN的这种设计使得它可以处理大量的数据，并适应时空连续的场景，如视频中的HOI识别。为了验证GPNN的有效性，研究者在三个HOI检测基准上对其进行了广泛评估，包括HICO-DET、V-COCO和CAD-120数据集。实验结果显示，GPNN显著优于现有的最先进的方法，这证明了其在大规模数据集上的扩展能力和在时间序列分析中的适用性。关键词涉及人机交互、消息传递、图解析和神经网络，强调了该方法的核心技术。GPNN的引入为HOI识别提供了一种新的途径，它不仅提高了识别的准确性，还展示了深度学习在解决涉及复杂关系推理的视觉问题上的潜力。总结起来，基于图解析神经网络的人-物交互学习是一种创新的方法，它通过构建和解析图结构来理解和识别图像中的交互行为。这种方法通过端到端的学习和消息传递机制，有效地融合了结构知识，提升了HOI识别的性能。在多个数据集上的实验结果证明了GPNN在该领域的优越性和应用前景。

展开

S.齐，W.王湾，澳-地Jia，J. Shen，S.-

C. 朱

虽然上述深度HOI模型取得了有希望的结果，但我们仍然观察到两

个未解决的问题。首先，他们缺乏一个强大的工具来明确地表示HOI

任务中的结构，并将其有效地编码到现代网络体系结构中第二，尽管

在特定任务中取得了成功，但缺少完整和通用的HOI表示。这些方法

不能容易地扩展到从视频中识别HOI为了解决这些问题，我们引入了

GPNN，用于将高级关系强加到DNN中，从而产生了适用于静态和动

态设置的强大HOI表示

神经网络与图形/图形模型。在文献中，提出了一些方法来结合图

形模型和神经网络。最直观的方法是在DNN上构建图形模型，首

先训练生成特征的网络，然后使用其输出来计算图形预测器的潜

在函数典型的方法用于人体姿势估计[42]，人体部位解析[33，45]

和语义图像分割[3，4]。这些方法缺乏深度集成，因为图形模型的

计算过程无法端到端学习。一些尝试[7，21，31，32，37，40，

44，51]被用来概括神经

网络操作（

例如，神经网络操作）

。

例如，

在一

个实施例中，卷积）直接从规则网格（

例如，在一

个实施例

中，图像）

到图形。然而，对于HOI问题，需要一个结构化的表示

来捕获人与对象之间的高级时空关系

其他一些工作将网络架构与图

形模型[12，20]集成在一起，并在场景理解[24，30，46]，对象检测和

解析[27，50]和VQA [41]等应用中取得了可喜的成果。然而，这些方

法

仅适用于具有预先固定的图结构的问题。Liang等人[26]在假设节

点是可合并的情况下，

使用长短期记忆（LSTM）合并图形节点用于

人类解析

这些方法在其特定任务中取得了令人鼓舞的结果，并很好地证明

了在完成具有特定领域结构的深度架构方面的好处。然而，他们中的

大多数是基于预先固定的图结构，他们还没有在HOI识别的研究。在

这项工作中，我们扩展了以前的图形神经网络与可学习的图结构，这

很好地解决了丰富的和高层次的关系，在HOI问题。所提出的GPNN

可以自动推断图的结构，并利用该结构来增强信息传播和进一步的推

理。它提供了一个通用的HOI表示空间和时空设置。据我们所知，这

是第一次尝试将图模型与神经网络集成在一个统一的框架中，以实现

HOI识别的最新结果。

HOI的图解析神经网络

3.1

制剂

对于HOI理解，人和对象由节点表示，并且它们的关系被定义为边。

给定一个完整的HOI图，其中包括所有可能的人和对象之间的关系，

我们希望通过保持有意义的边缘和标记的节点自动

下载后可阅读完整内容，剩余16页未读，立即下载

身份认证购VIP最低享 7 折!

30元优惠券

cpongm

粉丝: 6

图解析神经网络在人-物交互识别中的应用

神经网络图形分析

基于图神经网络的推理研究

人体-物体交互检测：关系解析神经网络方法

基于神经网络优化Cu-W-Ni电镀工艺.pdf

案例30 神经网络GUI的实现--基于GUI的神经网络拟合.7z

基于卷积神经网络的染色体交互预测算法.pdf

网络游戏-基于蛋白质交互作用网络的异病同治分子机理分析方法.zip

基于matlab的神经网络GUI的实现-基于GUI的神经网络拟合、模式识别、聚类内含数据集和源码.zip

网络游戏-基于FPGA加速卷积神经网络框架的图片处理方法.zip

网络游戏-基于正反卷积神经网络的时空大数据预测方法和系统.zip

最新资源