统一感知句法分析：深度学习与场景理解新突破

98 浏览量更新于2024-06-20 收藏 3.16MB PDF 举报

"面向场景理解的统一感知句法分析" 这篇论文提出了一种新的任务——统一感知解析（Unified Perceptual Parsing），旨在使机器视觉系统能够像人类一样，从一张图像中识别并理解尽可能多的视觉概念。这项任务超越了传统的单一任务识别，如物体分类、语义分割或纹理分析，而是尝试将这些任务融合在一起，实现多层次的视觉理解。作者们开发了一个多任务框架，名为UPerNet，该框架结合了深度神经网络，特别是利用了卷积神经网络（CNNs）和全卷积网络（FCNs）的能力，以处理异构的图像注释数据。通过这种框架，他们能够在单一网络中训练模型，使其能同时进行对象检测、语义分割、材质识别和纹理理解。UPerNet的训练策略允许模型从多种标注类型中学习，提高了模型对复杂场景的理解能力。实验结果显示，UPerNet在统一感知解析任务上表现出色，能够有效地分割出图像中的各种概念，包括物体、部分、材质和纹理。例如，它可以识别客厅中的咖啡桌、沙发、墙壁等物体，还能区分咖啡桌的腿、围裙和顶部，以及沙发的针织表面和地板的地毯材质。此外，模型的应用还扩展到了自然场景中视觉知识的发现，这表明其具有广泛的应用潜力。论文中提到的关键技术包括深度神经网络（DNNs）的使用，特别是它们在语义分割中的应用，这是计算机视觉领域的一个重要工具，允许模型在像素级别上理解图像内容。场景理解是另一个关键概念，它涉及到对图像的整体解读，包括场景类别、场景中的物体和它们之间的关系。同时，材料和纹理识别也是研究的重点，因为它们提供了关于物体表面性质的重要信息。通过UPerNet，研究人员展示了如何在深度学习模型中集成多种识别任务，以提高视觉理解的全面性和准确性。这种方法不仅在技术上具有挑战性，而且对于推动计算机视觉向更加人性化的理解和解释图像的方向发展具有重要意义。未来的研究可能会进一步探索如何将这种统一感知解析应用于实际场景，如增强现实、自动驾驶或智能安全系统，以提升这些领域的性能和用户体验。

T.肖氏Y.刘湾，澳-地Zhou，Y.

Jiang，J. 孙

定义统一感知解析

我们定义的统一感知解析的任务，从一个给定的图像中识别出许多视

觉概念。可能的视觉概念被组织成几个层次：从场景标签、对象和对

象的部分，到对象的材质和纹理。该任务取决于不同类型的训练数据

的可用性。由于没有一个图像数据集在多个层次上标注了所有视觉概

念，我们首先通过组合几个图像注释源来构建图像数据集。

2.1

数据集

为了从多个层次完成对各种视觉概念的分割，我们利用了广泛和密集标

记数据集（Broden）[26]，这是一个包含各种视觉概念的异构数据集。

Broden统一了几个密集标记的图像数据集，即ADE 20 K [2]、Pascal-

Context [27]、Pascal-Part [28]、OpenSurfaces [6]和可描述纹理数据集

（DTD）[4]。这些数据集包含各种环境中的各种场景、对象、对象部

件、材质和纹理的样本。对象、对象部分和材料被分割到像素级，同时

对纹理和场景进行注释

在图像级别。

Broden数据集提供了广泛的视觉概念。然而，由于最初收集它是为

了发现视觉概念与卷积神经网络（CNN）的隐藏单元之间的对齐以实

现网络可解释性[26，29]，因此我们发现来自不同类别的样本是不平

衡的。因此，我们标准化Broden数据集，使其更适合训练分割网络。

首先，我们合并不同数据集的类似概念例如， ADE 20 K、Pascal-

Context和Pascal-Part中的对象和零件注释将合并和统一。其次，我们

只包括出现在至少50幅图像中的对象类

，并且

在整个数据集中包含至

少50，000个像素此外，出现在至少20个图像中的对象部分可以被认

为是有效部分。将手动删除概念上不一致的对象和零件。第三，我们

手动合并OpenSur- faces中的采样不足标签例如，

石头

和

混凝土

合并成

石头

，而

透明塑料

和

不透明塑料

合并成

塑料

。出现在少于50个图像中

的标签也会被过滤掉。第四，我们将ADE20K数据集的400多个场景标

签映射到Places数据集的365个标签[30]。

表1显示了我们的标准化Broden的一些统计数据，称为Bro- den+。

它总共包含57

，

095个图像，其中22

，

210个图像来自ADE 20 K，

，

103个图像来自Pascal-Context和Pascal-Part，19

，

142个图像来自

Open- Surfaces，5

，

640个图像来自DTD。图2显示了对象的分布我们

还在图3中提供了来自Broden+数据集的每个源的示例。

剩余16页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

统一感知句法分析：深度学习与场景理解新突破

面向机器翻译系统句法分析器的研究与实现

句法分析前沿动态综述

依存句法分析代码.py

句法分析nlp 中文

怎么用语料库分析句法分析器的性能

自然语言处理的句法分析的主要内容

spacy+句法分析

日语依句法分析python

使用”资料-数据集“中的语料（data-忧国不谋生.txt)，进行句法分析（可参照资料中的实例）。 要求： 1.能够使用使用NLTK工具进行句法分析； 2.生成句法分析树； 3.进行依存句法分析；

中文句法分析的nlp模型哪一个最好？

最新资源

使用”资料-数据集“中的语料（data-忧国不谋生.txt)，进行句法分析（可参照资料中的实例）。要求： 1.能够使用使用NLTK工具进行句法分析； 2.生成句法分析树； 3.进行依存句法分析；