没有合适的资源?快使用搜索试试~ 我知道了~
基于点分布学习的无监督深度形状描述符研究及应用
1基于点分布学习的Yi Shi徐梦晨 Yuan Yi Fang <$NYU Multimedia andVisual Computing Lab纽约大学阿布扎比,阿联酋纽约大学,美国{yishi,jl8566,sy2366,yfang}@ nyu.edu摘要深度学习模型在用于3D形状检索、分类和对应的监督形状描述符学习方面取得了巨大成功然而,由于无监督神经网络架构的设计挑战,通过深度学习计算的无监督形状描述符比有监督的形状描述符研究得更少。本文提出了一种新的概率框架,用于点分布学习的无监督深度形状描述符的学习。在我们的方法中,我们首先将每个点与一个高斯分布相关联,然后将点云模型化为点的分布。然后,我们使用深度神经网络(DNN)来模拟传统上用迭代期望最大化(EM)过程解决的最大似然估计过程。我们的关键新颖性在于,我们在各种3D数据集上进行了定性和定量的比较表明,我们提出的方法实现了优于现有的无监督三维形状描述符的分类此外,我们通过实验验证了我们的形状描述符的以下吸引人的性质:多尺度形状表示、对形状旋转的鲁棒性以及对噪声的鲁棒性。1. 介绍随着距离传感器和成像技术的最新进展,3D几何数据已应用于各种应用中[2,32,22,46,45]。因此,开发可以自动分析大量3D几何数据的方法以用于不同任务(例如,*同等贡献†通讯作者图1.我们提出的无监督描述符学习方法与3D-GAN的说明[37]。与3D-GAN相比,我们提出的方法不需要生成器和判别器,而我们的框架只使用解码器提取形状描述符3D物体识别、分类、对应和检索)[4、5、3、11、40、39、37、18、38、10、9、25]。与最后,已经做出了很多努力,其中许多都集中在构建鲁棒的3D形状表示上。然而,3D对象的不规则属性和结构变化(即,具有不同姿势的3D人体模型、具有各种设计模式的3D汽车模型)对学习高质量3D形状描述符的任务提出了巨大挑战。深度神经网络(DNN)在处理2D图像方面的良好性能促使3D计算机视觉研究人员将3D几何数据转换为常规格式的体素网格,以便将3D数据馈送到深度网络架构[38]进行进一步处理。虽然将深度学习扩展到体积形状在概念上很简单,但3D卷积的计算成本严重限制了处理用于对象识别的3D几何数据的存储和计算效率[30]。93539354考虑到最常见的描述符提取方法是在监督学习中进行的,生成模型(如3DGAN [37])进入了一个未知的领域,其中可以以非监督方式生成3D形状描述符。尽管其在各种任务上具有良好的性能,但它仍然依赖于3D卷积层,其中考虑到体积变换的必要性,几何信息丢失是不可避免的它还受到其编码器和鉴别器结构的限制,因为它们仅在面对训练期间遇到的形状类别时专门进行特征提取。因此,预期在处理类别外数据时性能下降。在本文中,我们提出了一种新的零杆无监督的方法学习的实例级三维形状描述符。首先,我们声称一个点云实例可以由概率分布来描述,其中每个点都由高斯表示。为了获得给定形状实例的点的分布,在每个时期,我们合成与输入点云对应的新点云实例。为了详细说明合成过程,新点云中的每个点都是从多变量高斯分布的3D空间中采样的,该多变量高斯分布在原始点周围定义有固定的标准偏差σ在这里,我们把这个点云合成过程称为三维高斯采样。然后利用无编码器网络来对最大似然估计过程进行建模,其中网络学习预测分布的参数然后将计算原始3D点云实例和预测实例之间的L2距离,以训练所有训练数据的通用解码器和形状描述器为了生成任何点云数据的形状描述符,将在解码器训练阶段期间执行完全相同的操作,除了解码器将使用在训练阶段期间学习的权重来固定与其他生成结构相比,我们的无监督无编码器模型在两个方面更加通用:1)避免了针对不规则非网格点云设计特定的三维特征编码器; 2)它将我们的模型从针对训练期间遇到的类别优化的固定编码器权重的限制中解放出来。它增强了对看不见的类别外数据的特征学习。此外,通过我们的自动解码器网络(主要是MLP结构),与[19,37]中的复杂GAN结构相一致,我们的方法能够以无监督的方式有效地生成3D形状描述符。我们的贡献概述如下:• 使用高斯分布对点云进行建模的概率表示。点云实例的形状描述器可以通过以下方式显示:通过DNN求解分布的参数。• 一种无监督的形状描述符学习机制,可以生成对旋转和噪声鲁棒的形状描述符• 提出了一种新的多尺度形状描述符融合技术,该技术能够以由粗到细的方式表示实例,从而提高了我们的去噪性能在各种任务中的脚本。2. 相关作品2.1. 手工制作的3D形状描述符3D形状描述符是3D对象的简洁和紧凑的表示,其捕获3D对象的几何本质。已经开发了一些现有的形状描述符来描述3D对象[20,38,30]。人们已经提出了较早的D2形状分布、统计矩、傅立叶描述子、光场描述子、特征值描述子来描述三维形状,特别是对于刚性的三维物体。自旋图像[44]是基于3D点和表面法线的密集集合开发还有特征直方图[44]和基于一种统计几何特性的分布开发的直方图形状描述符的签名。通过热扩散几何学进一步发展了对鲁棒3D形状特征的一个全局形状描述符,称为温度分布(TD)描述符,是基于单一尺度的HKS信息开发的,以表示整个形状[14]。手工制作的形状描述符通常不足以处理3D真实世界模型中存在的结构变化和不完整性,并且通常不能推广到不同模态的数据。2.2. 形状特征学习首先引入特征袋(BOF)来学习提取用于形状检索的几何词的频率直方图[12,13,21]。为了学习全局特征,[15]采用具有HKS分布的自动编码器学习变形不变的形状描述符。深度学习的最新发展促使研究人员使用深度神经网络从大规模数据集中学习3D形状描述符。然而,为了将3D几何数据馈送到神经网络,3D几何数据通常被转换成3D体素网格或来自不同视图的2D投影图像的集合自20世纪80年代以来,体表示在计算机图形学领域扮演着重要的角色它为合成和测量对象提供了统一、简单和鲁棒的描述,并奠定了体图学的基础[23]。换句话说,体素是像素的扩展,而二值体是二值图像的扩展。近年来,许多研究人员开始在体积形状上开发3D CNN[38]将3D形状体素化为3D网格9355图2.培训过程。我们将随机初始化的向量z连接到采样实例形状的每个点。将计算解码点集和原始点集之间的L2点距离损失。在解码器训练阶段期间,将反向传播损失以同时更新形状描述符和解码器在描述符生成阶段期间,损失将仅用于更新形状描述符。并使用卷积深度信念网络训练用于3D形状识别的生成模型。类似地,[30]提出了一种实时3D监督学习架构,用于体积3D形状。除了有监督的CNN之外,[37]通过回顾体积CNN和GAN的进步,从概率空间生成3D对象,并且无监督特征可以广泛用于3D对象识别。[33]提出了一种用于识别3D形状的3D卷积自动编码器。除了直接的3D表示,3D形状也可以投影到2D空间。[34]提出了一种用于3D形状识别的多视图CNN,通过使用CNN从具有不同视图的图像中提取视觉特征,并采用跨视图的最大池化来学习一个紧凑的形状描述符。LFD [8]从球体上的相机渲染的光场中提取特征,以提高对旋转的鲁棒性。[6]提出了一种编码框架,用于基于从每个3D对象渲染的深度缓冲区格式的一组2D视图来构建紧凑描述符。2.3. 变分自动编码器变分自动编码器(VAE)[24]是另一种流行的生成框架,它从一组观察值X中学习概率分布P(X)。 假设我们有一个随机变量X代表一个分布。 的VAE使用具有z P φ(z)的先验分布的编码器和解码器Pθ(X)来映射分布|z)试图捕获给定z的X的分布。编码器和解码器同时被训练以最大化X的对数似然在训练之后,编码器映射Qφ(z|X)和解码器映射Pθ(X|Z)获得。实例生成和形状描述符获取然后可以用训练的模型来实现。2.4. 基于对抗网络的方法[17,29]已经证明了生成式广告网络(GAN)的有效性,其中一对神经网络通过追求竞争目标来共同学习,生成器学习从潜在空间到数据分布的映射,而搜索器学习区分地面真实数据和生成的数据。[37]将GAN的使用从2D图像扩展到体素化的3D网格。它的分类生成器学习从低维概率空间到三维形状的映射,而它的判别器提供了一个强大的三维形状描述符。它可以生成形状描述符,而无需监督。3. 方法3.1. 问题公式化考虑欧几里得空间S ={Xi}i=1,2,.其中,每个点云实例是N个点的集群Xi={xji}j=1,2,. N和xji∈ R3。3.2. 点分布表示在大多数应用中,点云要么通过扫描传感器获取因此,点云天生具有噪声和随机性。9356纪我纪)=e纪在追求鲁棒的表示时,为了简化我们的概率分布表示在一个简洁而富有表现力的形式,一个点xji∈R3的分布可以被看作是一个多元高斯分布。以平均值μji∈R3参数化的正弦分布,其中I∈R3×3是单位矩阵。因此,点分布关于对应的点坐标对称,并且受细化参数σ的影响。其影响将在第3.4节中介绍。为了描述点xji在实例Xi中的分布,通过在每个历元期间从以对应原始点为中心的高斯分布采样来合成新点x′。在多个时期之后,考虑到已经观察到足够的样本,预计点分布将得到良好呈现这种高斯采样过程也可以被看作是一种有效的数据增强技术,增加了数据的多样性这是在面对实例很少的类别时,使我们的零射击学习模型变得强大的关键因素之一 注意到Xi中的每个点分布都是独立的,采样实例X'的形状分布可以自然地建模为点分布的乘积。N可以获得形状描述符相比之下,我们杠杆年龄DNN模型这样的MLE过程中,在一个无监督的方式。3.3. 深度神经网络与最近提出的生成模型[24,37]中的常见方法不同,该方法通过编码和解码隐藏的潜在向量来建立从可能性分布到另一个分布的映射,我们的方法直接优化隐藏的潜在向量,确定从一个分布到另一个分布的映射,而无需编码-解码过程。它使我们摆脱了训练数据专用的编码器权重的限制,从而保证了对未知数据和类别的更好的泛化能力。从本质上讲,我们的模型通过优化一个潜在的编码,从高斯采样点描述的分布恢复到原始点,从而揭示了深层次的形状描述符参数。 在所提出的模型中,点云实例可以被认为是分布的分布。更具体地,点的分布作为整体描述形状的分布,并且实例本身的形状描述符被认为是来自所有形状描述符的分布为原始形状Xi,通过高斯函数创建合成形状XY′iP(Xi|θ)=j=0p(xji|θ)(1)在迭代中采样Xi中的点坐标为{x′}j=1,2,. N. 每一个单独的形状都是-对描述符Zi进行签名。的先验分布p(Zi),-1?x−μji?2其中p(x)是 |θ) = p(xji|μji1(2πσ2)32¨σ¨。对应的形状描述符Zi被设置为高斯,零均值 描述子Z的后验分布考虑到每个点对几何in-′i的贡献,整个点云实例的形成,为了评估点云,我们将独立点分布与实例的可能性由于我们的目标是获取一个实例的描述符,我们希望有足够的ge-给定一个合成点云实例Xi,分布参数θ可以用公式表示为:'YNP(Z|X,θ)=p(Z)p(x′|Z,θ)(3)可以通过求解分布的参数来学习度量信息。直觉上,这样的问题就迎刃而解了我我我j=0济一在最大似然估计其中p(x′|Zi,θ)描述了独立点概率吉(MLE)。给定形状的高斯样本xji的概率分布描述符和原始坐标。随着大量生成的合成点,P(Zi|X′,θ)→P(Zi|Xi,θ)θoptimal=argmaxP(X′|θ)′′我= argmaxθ我θ中国(2)log(p(x′|θ))j=0当Xi → Xi时,因此允许P(Zi|Xi,θ)近似到P(Zi|Xi,θ)。从管道的角度来看,我们分裂了去-脚本学习分为两个主要阶段,解码器训练阶段和描述符优化阶段。 形状描述符其中θ代表分布参数,包括所有点分布的平均向量。传统上,这里使用迭代优化方法,期望最大化(EM)算法。然而,由于EM算法的迭代特性,其精度和时间开销难以保证.更重要的是,我们无法将点分布与描述符潜在分布联系起来,被视为可学习的参数。每个描述符都是从零均值高斯初始化的,并与点坐标连接。然后,具有权重θ的解码器D接收潜在增强的坐标,并猜测潜在增强的坐标。相应点分布的平均值,如图2所示。将计算无监督自对应损失并优化9357i=1纪i=1纪i=0时i=0时图3.为了生成从粗到细的描述符,对样本进行不同尺度的标准差采样。模型在解码器训练阶段,我们的目标是优化解码器D的权重θ。求一个点和它的第十个最近邻点之间的距离的平均值。我们在表1中证明,我们的简单方法改进了最先进的结果。然而,网络仍然难以使用由单个固定σ合成的样本来学习包含从局部到全局尺度的信息的形状特征。如果与点之间的平均距离相比,σ被设置得太小通过简单地预测输入点坐标作为点分布的平均值,可以实现可以忽略不计的损失因此,解码器和形状描述符都没有被有效地优化。另一方面,设定得太高的σ破坏形状分布。点间距离小于σ的微妙几何细节被完全破坏了。来自类似类别的合成实例将是不可区分的。为了克服这一障碍,本文提出了一种多尺度特征融合方法,利用在不同σ设置下学习的形状描述子来表示由粗到细的形状信息。而不是使用来自具有固定标准偏差的高斯的合成大小的数据来我们计算了N组形状描述符{Zi}M,每ΣMΣNθoptimal,Zoptimal=argminL(Dθ(x′,Zi),xji)由用不同的标准DE-DE-σ合成的数据生成。对于点云中的每个点,θ,Zi=0j=0(四)计算其自身与其第十近邻之间的距离,并绘制直方图。从经验上讲,其中Z ={Zi}i=1,.,M. 在形状描述符优化阶段,所有先前学习的形状描述符都是丢弃并且固定学习的解码器权重在每次迭代中,单个实例执行与解码器学习阶段完全相同的采样序列。仅优化实例的对应形状描述符其中,σ1等于下20%的第十近邻距离的平均值,σ2等于全局平均值,σ1等于上80%的平均距离。最后,我们将实例的描述子连接为[Z1,Z2,Z3],形成对应点云集的新形状描述子证明了这一在实验中,它达到了最好的性能,ΣMΣNZoptimal=argminZL(Dθ(x′,Zi),xji)(5)分类任务比其他配置。4. 实验i=0j =0在这两个阶段中,选择欧氏距离作为我们的损失函数,因为它是比其他相似性度量更严格的评估对于A={ai}N和B={bi}N,ΣNL(A,B)=||aj−bj||第二章(六)j=03.4. 多尺度特征描述子在我们的设置中,影响采样过程的唯一变量是标准差σ。σ越大,合成点越可能远离原始位置。为了避免破坏实例中的几何信息或多次采样相似的点,我们通过计算来确定数据集的合适的全局σ值9358在本节中,我们首先介绍我们的实验设置,包括数据集和详细的网络架构。然后,我们证明了我们提出的形状描述符可以应用于三维形状识别任务,并验证了多尺度特征表示所做的改进。此外,我们展示了重建结果,并探讨了不同的σ值对以前的实验结果的影响。最后,我们进行了定量实验来验证我们的描述符的额外性质。4.1. 实验设置数据集:我们在实验中主要使用来自两个3D数据集的形状[7,43]。我们的通用解码器仅在ShapeNet中的七个主要类别上进行训练。主要的分类任务是在形状描述符上执行的9359图4.解码器模型ShapeNet的七大类别。为了进行准确率比较,我们还在整个ModelNet40基准上遵循与[37]相同的评估设置。然后,我们通过训练MLP作为分类器来评估生成的特征描述符。有一些无监督的方法[19,1,42],其中网络使用来自ShapeNet 55的全部55个类别进行训练,该类别总共包含由于实验中的数据设置不同,基于准确度的直接比较可能不是最合适的。表1显示了我们提出的方法与最先进的监督和无监督方法之间的性能比较我们的无监督形状表示优于3DGAN得分84。7%的Model-Net 40。认为模型中的大多数类别-Net40对我们的模型来说是完全新颖的,它展示了强大的类别外泛化能力。在整个ModelNet40上生成 3D点云重建实验在ShapeNet上进行了测试。我们还证明了我们的模型生成的形状描述符是强大的旋转和噪声进行ShapeNet上的实验。体系结构:我们将所有形状描述符的 大 小 设 置 为128. 如图4所示,随机初始化的形状描述符z与每个点的坐标连接并发送到解码器网络中。 网络架构该解码器由多个一维卷积和线性层组成在每三个1D卷积层之间,输出再次与形状描述符z连接。训练期间的批量大小设置为64。在描述符优化阶段,每个描述符应该仅由其自身的损失而不是一个批次内的平均损失来调节,这不可避免地导致批次大小为“1”。因此,在我们的网络结构中,选择层归一化层而不是批归一化层。因此,在我们的描述符生成过程中只利用了实例级信息,它允许我们的模型以在线方式生成每个实例的形状描述符在COM中,最近的方法(如[27])需要跨实例比较,并且性能严重依赖于目标数据集的大小。在解码器训练阶段,模型被训练200个epoch。在描述符优化阶段,每个描述符被训练100个时期。4.2. 无监督形状描述符评估利用监督学习提取形状描述符是一种性能优异的常用方法。然而,我们的模型以无监督的方式学习3D形状的形状描述符。在获得形状描述符后,我们通过执行分类任务对其进行评估。遵循证明类别外能力的思想,解码器在由以下组成的子集上进行训练:监理方法精度监督MVCNN[35] 90.1%[31]第31话美国有线电视新闻网(CNN)[26]美国有线电视新闻网[36] 92.2%[16]第一个在中国的例子是什么呢?VConv-DAE[33] 75.5%3D-DescripNet[41] 83.8%3D-GAN[37] 83.3%我们的84.7%表1.在ModelNet40上进行分类评估4.3. 多尺度表示为了验证我们的粗到细多尺度描述符的有效性,我们将其分类性能与用单个σ值优化的形状描述符进行了如第3.4节所述,多尺度描述符是通过连接多组形状描述符来获得的,每组形状描述符都是用不同的σ值训练的。实验设置:在本节中,我们将在ShapeNet中进行评估。然而,在训练期间仅使用属于七个主要类别的数据另一方面,评估是在包括保留类别的整个集合上执行用不同的σ值训练三组为了确定合适的σ值,我们评估了从形状实例中采样的2048个点的点云的单位密度我们通过特征缩放来规范化点云,并计算每个点到其第十个最近邻的距离 给定数据集内计算的距离分布,我们选择三个σ值0。04,0。08,0。12,σ=0。08平均值9360图5.σ = 0的形状描述子的重建结果。08个来自ShapeNet的所有实例的第十近邻距离。对于每个实例,使用不同的σ设置优化的形状描述符然后被连接。结果:如表2所示,多尺度形状描述符Zconcat优于所有单值形状描述符。实验证明,我们的形状描述子可以通过不同尺度的特征融合得到增强σ值。同样值得注意的是,当σ=0时,Z2. 08达到了最高的准确率,这表明我们选择最佳σ值的方法很好地适合我们的特征学习模型。形状描述符σ精度图6.σ = 0时形状重建结果的比较。04,σ = 0。08不同的种类碗Z10.04百分之九十一点四具有较低单位密度的点云的代表,而Z20.08百分之九十四点三lamp表示具有较高单位密度的点云。Z30.1292.9%Zconcat多尺度96.2%表2.ShapeNet上的分类评估用单σ值的形状描述子Z1,Z2,Z3优于多尺度描述子Zconcat4.4. 重建我们的方法允许重建点云从其采样实例与相应的优化形状描述符。我们检查了不同σ设置下的重建结果,并观察了来自不同类别的实例的结果。实验设置:重建实验是在第4.3节中解释的相同数据设置下进行的,我们使用标准差为σ的正态分布样本进行多个实验0.04和0.08。结果:如图5所示,如果σ设置为0.08,我们的形状描述符能够在类别外实例上实现很好的重建性能在图6中,具有复杂部件的项目在相对较小的σ设置下重建良好,但在较大的σ值下重建失败。有趣的是,具有很少细节的碗不具有使用具有小σ的相同解码器的令人满意的重建,而具有大σ的解码器更成功。重建质量相对于σ的不同选择的相对敏感性是我们在第3.4节中引入粗到细多尺度描述符的主要原因4.5. 旋转稳健性假设所提出的形状描述符是从点的分布到9361图7.旋转精度图对应的点原点,我们的方法预计将是更强大的旋转比直接从坐标提取几何信息。 这个测试旨在展示我们的模型在不同角度下对旋转形状进行分类的能力。实验设置:我们沿着每个轴从0到45度旋转,并以9度的间隔进行几次实验。沿每个轴旋转45度的形状如图7所示。旋转实例的描述符是使用4.2节中的七个主要类别训练的相同解码器生成的。对于每个级别的旋转,我们利用已经在七个主要类别上训练过的解码器,并对测试集中的旋转形状重复评估。结果:定量实验结果绘制在图7中。如在评估中所示,我们的方法实现了令人印象深刻的水平的性能时,旋转角度是在20度之内,因为准确度保持在93.0%以上。当形状旋转45度时,精度比不应用旋转的最佳性能下降2.3%。由于在每个轴上旋转45度显著改变了形状的方向,因此我们可以得出结论,我们的模型对旋转具有鲁棒性。4.6. 抗噪一个好的形状描述符还应该保持一致性,在形状的分类性能与一定量的噪声扰动。在这一部分中,我们进行了实验上的噪声点云和评估的抗噪声质量进行分类的形状在不同的噪声水平。我们的解码器能够克服噪声影响的数据,只要有足够的样本,小的随机扰动不会以显着的方式改变分布。实验设置:对应于噪声扰动测试实例的描述符是使用与第2.1节中的七个主要类别训练的相同解码器生成的 。图8.噪声-精度图,噪声水平代表高斯分布的标准差,用于生成要应用于原始实例4.2.在这个过程中,我们通过各种程度的噪声扰动点云。对于实例中的每个点,我们通过平移向量随机移动它,该平移向量遵循高斯分布,其坐标的平均值和标准差为0。00,0。02,0。04,0。06,0。08.我们将噪声水平定义为高斯分布的标准差。结果:定量实验结果绘制在图8中。当代表噪声水平的高斯标准差小于0时,我们的描述符的性能相对一致。04.随着应用于形状的更大级别的噪声,分类信息被严重破坏,甚至人类也难以识别。在这一点上,分类变得不那么有意义,所以我们不应用大于0.08的σ如图8所示,我们可以得出结论,我们的形状描述符是合理的抵抗高斯噪声扰动。5. 结论在本文中,我们介绍了另一种非监督的方法来计算实例级形状描述符,通过建模的最大似然估计过程与编码器的自由网络。 我们提出了一种多尺度描述符融合技术,可以表示一个实例在一个由粗到细的方式,提高了整体性能。此外,我们用实验证明了我们的描述子具有出色的抗噪声和旋转不变性。6. 确认我们要感谢所有的审稿人,感谢他们为改进我们的稿件而提出的富有洞察力的建议和努力。这项工作得到了纽约大学研究增强基金(No.RE132)的部分支持。9362引用[1] P. Achlioptas、O.迪亚曼蒂岛Mitliagkas和L.吉巴斯三维点云的学习表示与生成模型。arXiv预印本arXiv:1707.02392v3,2018。6[2] A. Albarelli,E. Rodo la`,F. Be rg amasco和A. 托瑟罗杂乱场景中3d物体识别的非合作博弈。在3D成像、建模、处理、可视化和传输上,第2521[3] S. Bai,X.拜角,加-地Tian和L. J. Latecki面向对象检索的双向上下文正则化扩散过程。IEEE Transactions onPattern Analysis and Machine Intelligence,PP(99):1-1,2018。1[4] S. Bai,S.太阳,X.白氏Z. Zhang和Q.田利用平滑邻域提高上下文相关相似度的目标检索方法。模式识别,83:353- 364,2018。1[5] S.白氏Z.作者简介:王建,张世文.巴伊湖,加-地J.Latecki和Q. 田三维形状和图像检索的自动集成扩散。IEEE Transactions on Image Processing,PP(99):1- 1.1[6] X. Bai,S.白氏Z. Zhu和L. J. Latecki通过两层编码的3D形状 匹配 。IEEE Transactions on Pattern Analysis andMachine Intelligence,37(12):2361-2373,2015。3[7]A. X. 张, T. 放克豪瑟 L. 吉巴斯 P. 汉拉汉Q. Huang,Z. Li,S. Savarese,M. Savva,S.宋,H. 苏肖湖,加-地Yi和F. Yu. ShapeNet:一个信息丰富的3D模型库。技术报告arXiv:1512.03012 [cs.GR],2015。5[8] D. Chen,X.田氏Y. Shen和M.欧英基于视觉相似性的三维模型检索研究。在计算机图形论坛,第223-232页,2003年。3[9] 陈杰湖,澳-地王湖,加-地Xiang和F.逸Arbicon-net:用于图像配准的任意连续几何变换网络。第三十三届神经信息处理系统会议,2019年12月。1[10] J. Chen和F.逸基于草图的3d形状检索中通过语义学保持对抗学习的深度跨模态适应。欧洲计算机视觉会议(ECCV),2018年。1[11] G. Dai,J. Xie,and Y.房.基于草图的三维形状检索的深度 相 关 整 体 度 量 学 习 。 IEEE Transactions on ImageProcessing(TIP),2018。1[12] M. Eitz、J. Hays和M. Alexa人类如何绘制物体?ACM事务处理图表,31(4):44-1,2012. 2[13] M. Eitz,K. Hildebrand,T. Boubekeur和M. Alexa基于草图 的 图 像 检 索 : 基 准 和 特 征 袋 描 述 符 。 IEEEtransactions on visualization and computer graphics,17(11):1624-1636,2011。2[14] Y.芳,M. Sun和K. Ramani用于鲁棒三维形状检索的温度分 布描 述子 。在 计算 机视 觉和 模式 识别 研讨会(CVPRW),第9IEEE,2011年。2[15] Y. Fang,J.Xie,G.戴,M.Wang,F.Zhu,T.xu和E.黄。3D深度形状描述符。在IEEE计算机视觉和模式识别会议上,第2319- 2328页,2015年。2[16] R. Girdhar,D. F. Fouhey,M. Rodriguez和A.古普塔。学 习 对 象 的 可 预 测 和 生 成 矢 量 表 示 。 CoRR ,abs/1603.08637,2016。6[17] I. 古德费罗 J. 波吉特-阿巴迪 M. 米尔扎 B. 许、D. 沃德-法利,S。奥扎尔A.Courville和Y.本吉奥。生成对抗网络。在神经信息处理系统的进展,第2672-2680页,2014年。3[18] Z. H. M.- Y. L. S. B. B. H. 杨贯道,荀煌。点流:三维点云生成与连续规范化流程。在计算机视觉和模式识别,第252-259页,2019年。1[19] Z.汉,M。尚,Y. Liu和M.兹维克查看帧间预测gan:通过学习全局形状记忆来支持局部视图预测的3d形状无监督表示学习。AAAI,2019年。二、六[20] V. Hegde和R.扎德Fusionnet:使用多种数据表示的3d对象分类。2016. 2[21] R. Hu和J. Collomosse.基于草图的图像检索中梯度场Hog描述子的性能评价。计算机视觉和图像理解,117(7):790- 806,2013。2[22] S. Katz,G. Leifman和A.塔尔基于特征点和核提取的网格分割。Visual Computer,21(8- 10):649-658,2005. 1[23] A. Kaufman,D. Cohen和R.雅格尔 体积图形。Computer,26(7):51-64,1993. 2[24] D. Kingma和M.威林自动编码变分贝叶斯。国际学习代表会议(ICLR),2015年。三、四[25] X.利湖,澳-地Wang和Y.房. PC网络:使用神经网络进行无监督点对应学习2019年3D视觉国际会议(3DV)。1[26] Y. 利河,巴西-地布,M。太阳,W。Wu,X.Di和B.尘Pointcnn:x变换点上的卷积。In S. Bengio,H. Wal-lach,H.拉罗谢尔湾格劳曼塞萨-比安奇,R. Garnett,编者,《神经信息处理系统进展》,第820-830页Curran Associates,Inc. 2018. 6[27] Z. Z.凌章。图卷积神经网络对比聚类点云无监督特征学习3DV,04 2019. 6[28] X. Liu,Z.汉,Y.- S. Liu和M.兹维克点2序列:以注意力为基础的序列到序列网路学习三维点云的形状表示。2019. 6[29] D. Lowd 和 C. 温 顺 对 抗 性 学 习 。 在 第 十 一 届 ACMSIGKDD国际会议上,数据挖掘中的知识发现,第641ACM,2005年。3[30] D. Maturana和S.谢勒Voxnet:用于实时对象识别的3D卷积神经网络。在INUS/RSJ智能机器人和系统国际会议上,第922-928页,2015年。一、二、三[31] C. R.齐湖,加-地Yi,H. Su和L.吉巴斯 Pointnet++:度量空间中点集的深度层次特征学习。神经信息处理系统进展30,第5099-5108页,2017年。69363[32] E. Rodola,A.M. Bronstein,A.Albarelli,F.贝加马斯科,以及A. 托瑟罗变形形状匹配的博弈论方法在IEEE计算机视觉和模式识别会议(CVPR)中,第182-189页。IEEE,2012。1[33] A. Sharma,O. Grau和M.弗里茨Vconv-dae:无对象标签的深度体积形状学习。在欧洲计算机视觉会议上,第236-250页,2016年。三、六[34] H. Su,S.Maji、E.Kalogerakis和E.学习米勒。用于三维形状识别的多视卷积神经网络2015年12月。3[35] H.苏C. R. Qi,Y. Li和L.吉巴斯为cnn渲染:使用经渲染3d模型视图训练的cnn进行图像中的视点估计。在IEEE国际计算机视觉会议(ICCV)上,2015年12月。6[36] Y. Wang,Y.太阳,Z.Liu,S.E. Sarma,M.M. 布朗斯坦,还有J. M.所罗门点云学习的动态图cnn。ACM Transactionson Graphics(TOG),2019年。6[37] J.Wu,C. Zhang,T.薛,W. T. Freeman和J. B.特伦鲍姆。通过3d生成对抗建模学习物体形状的概率潜在空间。神经信息处理系统进展,第82-90页,2016年一二三四六[38] Z. Wu,S.Song,中国黑杨A.Khosla,F.于湖,加-地Zhang,X.唐和J.肖。3d shapenets:体积形状的深度表示。在IEEE计算机视觉和模式识别会议上,第1912-1920页一、二[39] J. Xie,G. Dai,F. Zhu,E. Wong和Y.房. Deepshape:深度学习的形状描述符,用于3D形状检索。IEEETransactions on Pattern Analysis and Machine Intelligence(TPAMI),2016年。1[40] J.Xie和Y.房.基于草图的三维形状检索的三维形状重心表示学习。IEEE计算机视觉与模式识别会议论文集,2017。1[41] 谢杰,Z.郑河,巴西-地高,W. Wang,S. Zhu和Y.吴用于三维形状合成与分析的学习描述符网络。IEEE计算机视觉和模式识别会议,2018年。6[42] Y.杨角,澳-地冯,Y. Shen和D.田Foldingnet:通过深度网格变形的点云自动编码器。在IEEE计算机视觉和模式识别会议(CVPR),第3卷,2018年。6[43] A. K. F. Y. L. Z. X. T. Z. Wu , S. Song 和 J. Xiao. 3DShapeNet:体形状的深度表示。IEEE计算机视觉与模式识别会议(CVPR),2015年。5[44] A. Zeng,S. 宋,M。 尼斯纳湾 费舍尔,J.肖,和T.放克豪瑟3dmatch:从rgb-d重建中学习局部几何描述符。在IEEE计算机视觉和模式识别会议(CVPR),2017年。2[45] F. Zhu和Y.房.三维形状分析的热扩散长短期分类学习。欧洲计算机视觉会议(ECCV),2016年。1[46] J. Zhu和Y.房.从单目图像中学习特定对象的距离。IEEE计算机视觉国际会议(ICCV),2019年10月。1
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- BottleJS快速入门:演示JavaScript依赖注入优势
- vConsole插件使用教程:输出与复制日志文件
- Node.js v12.7.0版本发布 - 适合高性能Web服务器与网络应用
- Android中实现图片的双指和双击缩放功能
- Anum Pinki英语至乌尔都语开源词典:23000词汇会话
- 三菱电机SLIMDIP智能功率模块在变频洗衣机的应用分析
- 用JavaScript实现的剪刀石头布游戏指南
- Node.js v12.22.1版发布 - 跨平台JavaScript环境新选择
- Infix修复发布:探索新的中缀处理方式
- 罕见疾病酶替代疗法药物非临床研究指导原则报告
- Node.js v10.20.0 版本发布,性能卓越的服务器端JavaScript
- hap-java-client:Java实现的HAP客户端库解析
- Shreyas Satish的GitHub博客自动化静态站点技术解析
- vtomole个人博客网站建设与维护经验分享
- MEAN.JS全栈解决方案:打造MongoDB、Express、AngularJS和Node.js应用
- 东南大学网络空间安全学院复试代码解析
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功