基于3D形状信息的无监督特征学习方法

73 浏览量更新于2024-06-20 收藏 1.19MB PDF 举报

ShapeCodes：基于3D形状信息的无监督特征学习 ShapeCodes 是一种基于3D形状信息的无监督特征学习方法，它可以将3D形状信息嵌入到单视图图像表示中。该方法的主要思想是一个自我监督的训练目标，只给单个2D图像要求对象的所有不可见视图可从学习的特征预测。 ShapeCodes 的工作流程是将未知类别和未知视点的输入图像映射到潜在空间，然后从该潜在空间中“提升”该图像到包含从所有视角示出的对象的视图网格。这个方法可以捕捉基本形状原语和语义规律的数据驱动的方式，不需要手动语semantic标签。 ShapeCodes 的优点是可以学习到3D形状规则的有价值的线索，嵌入到特征空间中，并且可以用于类别识别任务。这个方法可以解决传统的视觉识别方法的局限性，如人工监督昂贵、不是所有的对象都是由它们的纹理很好地定义的，以及学习视点特定的类别模型是麻烦的。 ShapeCodes 的关键技术是提升视图到Viewgrids的技术，该技术可以将2D图像提升到3D视图网格中，从而学习到3D形状信息。这个技术可以解决视觉识别中的基本障碍，即学习到的表示限制在2D域。 ShapeCodes 的潜在空间可以捕捉到基本形状原语和语义规律的数据驱动的方式，这种方式可以解决人类视觉系统中的问题，即从2D视图推断3D几何形状。这个方法可以用于物体识别、图像分类、物体检测等领域。 ShapeCodes 的优点还在于可以学习到类不可知的特征表示，这种表示可以跨越对象类别边界，捕捉到基本形状原语和语义规律的数据驱动的方式。这个方法可以解决传统的视觉识别方法的局限性，即学习到的表示限制在类别边界中。 ShapeCodes 是一种基于3D形状信息的无监督特征学习方法，可以学习到3D形状规则的有价值的线索，嵌入到特征空间中，并且可以用于类别识别任务。这个方法可以解决视觉识别中的基本障碍，具有广泛的应用前景。

D.贾亚拉曼河Gao和K. 格劳曼

多视图几何[2，54]。对象形状的基于图像的模型（隐式地）与轮廓图像

相交以雕刻视觉外壳[39，45]。

学习

2D-3D

关系

最近，人们

对

学习视图与其底层3D形状之间的连接感兴

趣我们主要从两方面处理这个问题：基于图像和体积。基于图像的方法

将新视图推断为指定视点的函数。给定两个2D视图，他们学习预测中间

视图[12，16，24，33]。在仅给定单个视图的情况下，它们学习根据新的

相机姿势来渲染观察到的对象，例如，通过使用深度逆图形网络[38]、

张量完成[7]、递归编码器-解码器网络[31，68]、外观流[70]或将部分

RGBD转换为全景图[57]进行解纠缠。访问合成对象模型对于训练生成

CNN特别有价值[14]。体积方法替代地将视图直接映射到对象的3D表

示，诸如体素占用网格或点云，例如，使用3D递归网络[8]，直接预测

3D点[15]，或生成嵌入[19]。虽然大多数努力研究合成3D对象模型（例

如，CAD数据集），最近的工作也冒险进入现实世界的自然图像[36]。

除了体素之外，推断深度图[59]或关键点图[62]提供了3D结构的有价值的

表示。

我们的工作建立在学习2D-3D关系方面的这些进步，以及我们基于

特定卷积自动编码器（CAE）的流水线（Sec. 3.2)与像素输出任务的

事实上的标准架构相呼应[38，44，59，67，69]。然而，我们的目标

与上述任何一个都不同尽管现有的方法开发了类别特定的模型（例

如，椅子，汽车，面孔），并寻求高质量的图像/体素作为最终产

品，我们训练了一个类不可知模型，并寻求一个可转移的图像表示用

于识别。

方法

我们的目标是学习一种表示，该表示将单个图像从任意（未知）视点

和任意的空间提升

到对象的

形状可预测的空间

其

ShapeCode

。这个

任务的“精神旋转”的对象从其观察到的观点，以任意的相对姿态需要

从单一的2D视图，这是有价值的识别3D理解

。通过对一次性形状重建

任务进行训练，我们的方法旨在学习嵌入这种3D理解的图像表示，

并将所得嵌入应用于单视图识别任务。

3.1

任务设置：一次性视图栅格预测

在训练过程中，我们首先从每个对象周围的观察球体均匀地采样视图。

为此，我们通过选择M个相机方位角的集合

Saz

{360°/M

，

720°/M

，

. . .

360

°}围绕对象。然后，我们在

{

，

180

（

−

1）

，

360

（

−

）

，

···

}

上选择

个相机的集合

S el

。

我们现在采样对应

于笛卡尔坐标的每个对象的所有

视图

剩余16页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

基于3D形状信息的无监督特征学习方法

数据手册-SN75176B-datasheet.zip

基于javaswing酒店点餐系统

WinPE-26241.5000-ReFS-v3.14.wim

Kubernetes系统精讲 Go语言实战K8S集群可视化--第8章 【核心知识+原理分析】将应用和配置分离.zip

节能减排商品类别.doc

三废污染+区域经济数据整理-最新出炉.zip

评标委员会成员评标意见表.doc

E056AER部分文献及其复现数据与程序_共37篇-最新出炉.zip

aDrive-6.5.0.exe

基于VB实现的简单小游戏设计毕业设计(源代码+论文+开题报告+中期报告+外文文献)

最新资源

Kubernetes系统精讲 Go语言实战K8S集群可视化--第8章【核心知识+原理分析】将应用和配置分离.zip