属性建模：将属性视为操作符的新视角

140 浏览量更新于2024-06-20 收藏 1.23MB PDF 举报

"属性建模作为操作符的新方法" 本文探讨了一种创新的视觉属性建模方法，将属性视为操作符而非传统的与对象关联的特征。这种方法由Tushar Nagarajan和Kristen Grauman提出，他们来自德克萨斯大学奥斯汀分校和Facebook人工智能研究。传统的属性建模方式是通过学习分类器来识别对象及其相关的属性，如将"切片的"属性与"苹果"对象结合。然而，这种做法限制了模型对新属性-对象组合的理解，因为它们无法将训练中观察到的属性与对象分离。作者提出将属性建模为操作符，这种方法可以明确地从属性伴随的对象中分解出属性，同时利用语义嵌入来表达属性操作的效果。这一新颖的正则化器有助于消除属性应用时可能产生的不期望的强烈效果。这种建模方式不仅符合属性作为语言修饰语的角色，而且能够概括出对象的不可见属性和组件。在两个具有挑战性的数据集上，该方法显示出了对现有技术的显著改进，特别是在识别未见过的属性组合和对象组合方面。这意味着模型能够适应开放世界的环境，即使在训练期间未出现过的情况也能进行识别。这扩展了属性建模的应用范围，使其不仅适用于图像搜索、零样本学习、叙述生成或图像生成，还能处理更复杂的视觉理解任务。属性和对象之间的区别在于，对象是物理实体，而属性是这些实体的特性。尽管如此，现有的属性识别方法往往沿用了对象识别的方法，依赖于判别模型，如卷积神经网络，从带有属性标签的图像中学习。但这种方法存在局限性，因为学习到的潜在向量可能难以捕捉到与对象独立的属性表示。将属性建模为操作符提供了一种更为灵活和强大的表示方式，能够更好地理解和处理视觉内容中的复杂关系，尤其在面对未知属性-对象组合时表现出了良好的泛化能力。这种方法为未来的研究提供了新的视角，有望推动属性识别和视觉理解领域的发展。

T. Nagarajan和K. 格劳曼

而不是把属性和对象一样的分类器向量，并放置在一个单一的网络学习的负

担，我们提出了一个因素的表示的成分，建模属性-对象组合作为一个属性特定

的可逆

变换

对象向量。我们的配方还使新的正则化的基础上的属性的语言意

义。我们的模型自然地扩展到对象本身在训练过程中不可见的组合，不像[5，

33]那样需要为每个新对象训练SVM分类器。此外，不是像[33]中那样专门预测

看不见的成分，我们还研究了更现实的场景，其中

所有

成分都是识别的候选

者。

视觉转换。视觉“状态”的概念已经从几个角度进行了探讨。给定一组图像[20]或

延时视频[60，27]，方法可以发现对象状态之间的映射变换，以创建新图像或

可视化它们的关系。给定视频输入，动作识别可以看作是学习视觉状态转换，

即学习视觉状态转换

例如，在一

个实施例中，一个人如何操纵一个对象[12，2]

或活动前置条件如何映射到后置条件[51]。给定相机变换，其他方法从指定的

新视点[22，59]可视化场景虽然我们分享捕捉视觉变换的一般概念，但我们是

第一个提出将建模属性作为改变对象状态的操作符的人

使用样本合成的低拍摄学习。最近的工作探索了为很少出现的类生成合成训练

示例的方法，无论是在特征[10，14，31，52，61]还是整个图像[57，8]方面我

们新颖的正则化方法的一部分还涉及假设的属性转换示例。然而，尽管先前的

工作显式地离线生成样本以增强数据集，但我们的特征生成是一个隐式的过程

来正则化学习，并与其他新的约束（如逆一致性或可交换性）协同工作（见第

3.3节）。

方法

我们的目标是识别属性-对象组合（e。

例如，在一

个实施例中，切片香蕉，毛

茸茸的狗）的图像。传统的分类方法受到复杂概念的长尾分布[42，30]和推广

到看不见的概念的有限能力的影响。相反，我们对合成过程本身进行建模。我

们分解出训练过程中看到的底层原始概念（属性和对象），并将它们用作构建

块来识别推理过程中看不见的组合。我们的方法是由基本叙事驱动的：

如果我

们看到了一个切片的橙子，一个切片的香蕉和一个腐烂的香蕉，我们能预测腐烂的橙子

是什么样子吗？

我们围绕属性的功能角色建模的组成过程。而不是把对象和属性等同于向

量，我们模型的可逆运营商的属性，和组合作为一个属性条件的转换

应用

到对

象向量。然后，我们的识别任务变成了一个嵌入学习任务，在这个任务中，我

们将图像和成分投影到一个共同的语义空间中，以识别当前的成分我们用与属

性的语言行为一致的新正则化器来指导学习

剩余17页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

属性建模：将属性视为操作符的新视角

数据流建模PPT课件.ppt

2016美国大学生数学建模竞赛英文文献检索方法与技巧（第3版） 共91页.pdf

电子功用-基于遗传编程的火电机组煤耗特性曲线建模方法

外文;统一建模语言UML 分层抽象建模机制，无中文

通过自动机建模语法演变

统计建模与R软件

Verilog算术操作符详解与EDA先锋工作室资源

面向对象设计：交互片断操作符critical与模块化

R语言自定义二元操作符及KUKA机器人EtherCAT通信配置

rhino7: 探索三维建模软件的最新创新

最新资源

2016美国大学生数学建模竞赛英文文献检索方法与技巧（第3版）共91页.pdf