Conv-MPN网络用于户外建筑重建

17 浏览量更新于2023-10-25 收藏 2.56MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

1Conv-MPN：用于结构化户外建筑重建的卷积消息传递神经张富阳，Nelson Nauata，Yasutaka Furukawa SimonFraser University，BC，Canada{fuyangz，nnauata，furukawa}@ sfu.ca输入Conv-MPN重建地面实况迭代0迭代1迭代3图1. Conv-MPN是一种新型的消息传递神经网络，它从单个图像中将室外建筑物重建为平面图。消息传递的0、1或3次迭代后的重构如图所示。摘要本文提出了一种新的消息传递神经（MPN）架构Conv-MPN，它从一个单一的RGB图像重建一个Conv-MPN是专门为图的节点具有显式空间嵌入的情况而设计的。在我们的问题中，节点对应于图像中的建筑边缘Conv- MPN与MPN的不同之处在于：1）与节点相关联的特征被表示为特征体积而不是1D向量;以及2）卷积编码消息而不是完全连接的层。Conv-MPN学习选择节点的真实子集（即，构建边）以重构构建平面图。我们对2,000多座建筑物的定性和定量评估表明，Conv-MPN比现有的全神经解决方案有了显着的改进。我们相信，本文有可能打开一个新的路线图神经网络的研究结构化几何重建。1. 介绍人类的视觉进化到掌握整体图像理解，能够检测结构元素，在一个im-*表示同等贡献。年龄和推断他们的关系。看图中的卫星图像. 1.一、我们可以快速地看到三个建筑构件，检测它们的建筑拐角，并识别与相邻构件的共同边缘。这种结构化几何的最终形式是CAD表示，其实现了广泛的应用，例如渲染、效果映射、模拟或人类交互。不幸的是，CAD模型识别仍然是计算机视觉的一个开放性问题，并且只有专家建模者才有可能。为了实现CAD几何图形的自动化构造，深度神经网络（DNN）的出现为低级图元（例如，角落）。然而，对高级几何结构的整体理解（例如，图的推理）仍然是DNN的挑战。当前的最新技术利用DNN进行低级原语检测，但采用优化方法进行高级几何结构推断[21，16]。优化是强大的，但需要复杂的问题公式和密集的工程注入结构约束。本文旨在推动深层神经架构的边界，以完成结构化几何体的重建任务。特别是，我们提出了一个卷积消息传递神经网络（Conv-MPN）。Conv-MPN是图神经网络（GNN）的一个变体，并学习推断关系。27982799通过交换消息来实现节点间的关系。Conv-MPN是专为节点具有显式空间嵌入的情况而设计的，与标准消息传递神经网络（MPN）有两个关键区别：1) 节点的特征被表示为CNN中的3D体积而不是1D向量;和2）卷积编码消息，而不是完全连接的层[24，25]或乘法[5，8]。这种设计允许Conv-MPN利用与节点相关联的空间信息我们已经证明了Conv-MPN在室外建筑矢量化问题上的有效性[21]，其中输入是卫星RGB图像，输出是描绘内部和外部建筑特征线的平面图。这对于计算机视觉来说是一个具有挑战性的问题，类似于平面图矢量化，直到最近才有了有效的解决办法[19]。主要的挑战在于具有任意拓扑的图结构的推断由于前缩短效应的存在，使得曼哈顿假设不成立，因此从卫星影像进行室外建筑矢量化更加困难。我们还想强调与传统的建筑物形状提取问题[1]的区别，传统的建筑物形状提取问题[ 1 ]将建筑物表示为一组像素。我们对亚特兰大、拉斯维加斯和巴黎的2,000多个复杂建筑实例进行了定性和定量评估[21]。Conv-MPN在所有现有的神经网络解决方案上做出了显著的改进。我们相信，这项研究有可能为结构化几何重建开辟一条新的图神经网络研究路线。代码和预训练模型可以在https：//github上找到。com/zhangfuyang/Conv-MPN.2. 相关工作我们首先回顾结构化重构技术的基础上的层次图结构推断，然后使用消息传递技术的结构化数据。使用固定拓扑进行重建：使用固定的已知拓扑，图重建相当于简单地检测关键点并对其语义类型进行分类，因为它们的连接已经给出。卷积神经网络已被证明在解决人体姿势估计[22，31，29]和手部跟踪[34，38，30]方面是有效的。低级到中级结构化重建：DNN检测角落并对其连接的存在进行分类，以进行线框解析[15，37，36]。然而，连接分类是针对每个边缘独立地执行的在遥感中，大多数建筑物提取方法将建筑物表示为一组像素[14]或1D多边形环[2，6，20，7]，将输出限制为将外部边界构建为1D循环。相比之下，我们试图推断一个任意的拓扑结构编码的内部和外部的建筑特征线的图形结构化重建（优化）：最先进的图结构推理结合了CNN 和优化，特别是整数规划（IP ）[19 ，18，21]。CNN检测低级几何图元（例如，角）或推断逐像素图形信息（例如，edge like- lihood）。 IP融合了所有信息并推断出图结构，这是强大的，但需要复杂的问题仿真和密集的工程注入结构约束。结构化重建（学习）：一些方法学习推断高级几何结构。里奇和 al. [27]使用DNN学习画布上2D笔画的排列，使用类似于L系统的简单形状语法。Frans等人[12 ]第10段。提出了一种无监督的方法来解决这个问题。然而，它们的语法太过原始，无法表示建筑结构。Zeng等人[35]利用建筑形状语法从正射校正深度图重建室外建筑物然而，他们的形语法又是限制性的：1）需要正射校正以利用曼哈顿假设;以及2) 仅为小型住宅建模。本文不依赖形状文法，而是从实例中学习结构规则，并将其用于结构推理。图上的消息传递和卷积：消息传递是高级数据推理的有效工具[23，3，13，17，9，32，4]。一种标准的方法是将卷积运算扩展到像素网格上的顶点图[5，17，9，10，23]。 Bruna等人[5]，Dandyet al.[9] Kipfet al. [17]利用谱分析来定义作用于整个图的图卷积关键的区别是，我们的卷积不会发生在图域中。Conv-MPN采用具有显式空间嵌入的图，将节点表示为特征体积并在空间域中执行卷积。该框架允许Conv-MPN利用与图的节点相关联的空间信息3. 预赛本文从一个单一的卫星图像，其中一个建筑物表示为一个二维平面图的二维建筑矢量化问题。本节介绍我们的数据源和预处理步骤（见图1）。2）。数据集：我们的数据源是来自SpaceNet [11]语料库的一组高分辨率卫星RGB图像，作为SpaceNet Challenge[1]的一部分，通过Amazon Web Services（AWS）特别是，我们使用现有的基准点[21]，将亚特兰大，巴黎和拉斯维加斯的2，001座建筑物裁剪成256×256平方的图像块[21]。我们使用相同的培训和测试分割2800输入角点枚举图2.准备工作。给定一幅RGB图像，我们检测建筑物角点候选，枚举建筑物边缘候选，然后形成一个图的推理，其节点是建筑物边缘。(1601/400）以及指标，其中包括前，梅。我们通过扩张残差网络（DRN）[33]传递一个与二进制建筑物边缘掩模（256×256×4）连接的建筑物RGB图像来初始化特征体积（见图）。（3）第三章。更具体地说，我们使用DRN-C-26架构的前三个块，然后是一个3×3步幅2卷积，用于下采样到64×64×32。在训练过程中，我们通过ImageNet上的预训练权重初始化网络参数[28]。14.2.卷积消息传递MPN中特征向量更新的标准形式是利用多层感知器（MLP）来编码消息并与当前功能：混合：每个角、边和区域基元的cision、recall和f1分数请注意，卫星图像偏离了最低点，由于透视缩短效应，建筑物并不遵循曼哈顿平面。Σfv←MLPfv;w∈N（v）MLP（fv;fw（1）角点候选枚举：给定一个输入 RGB 图像块 I（256×256），我们使用Faster-RCNN和ResNet-50作为骨干[26]来检测角点候选，同时将每个角点视为一个8 × 8的边界框，其中一个角点位于中心。该模型使用SGD进行训练，学习率设置为0。0001和批量1。图形公式：给定建筑角点候选者，我们通过每对角点枚举建筑边缘候选者。每个边缘候选者在下一步中成为用于Conv-MPN推断的图中的节点（参见图11）。2右）。当对应的建筑物边缘共享相同的建筑物拐角时，节点被连接。注意到我们表示与节点v相关联的特征向量，N（v）表示相邻节点的集合，并且“;”表示特征级联。虽然Conv-MPN可以简单地用CNN替换MLP来形成特征更新规则，但这需要两个CNN模块，因此需要更多的GPU内存。一个节点特性分布在一个卷上，一个简单的池可以将所有信息保持在一个消息中而不会发生冲突。更准确地说，不是为每一对编码一条消息，我们只是将所有相邻节点的特征集中起来编码一条消息，然后用CNN更新一个特征向量：有一个建筑平面图和图的Conv-MPN推理。当术语混淆时，我们明确地写fv←CNNΣΣfv;池fww∈N（v）.（二）4. Conv-MPN架构Conv-MPN背后的基本思想简单而强大。标准图神经网络（GNNs）[4]将几何信息编码为1D矢量，而不是空间上的3D特征体积。具有1D特征向量的MLP不能进行有效的几何分析，而与3D特征体积的卷积可以进行自然的空间推理。我们的想法是采用标准的MPN架构，然后用潜在的3D体积代替1）用于特征表示的潜在向量;以及2）具有用于消息编码的卷积的全连接层（或矩阵乘法）。本节解释了特定于我们的问题设置的Conv- MPN架构，但将该框架扩展到整个GNN家族是很简单的。4.1. 特征初始化推理图中的节点对应于建筑物边缘，其将被表示为3D特征体积。我们试验了max，sum和mean poolings，max pooling效果最好。由于GPU内存的限制，我们最多执行3次功能更新迭代CNN模块由7个Conv-ReLU-BN块组成，这些块在不同的迭代中不共享。我们使用 Conv-MPN（t=x）来表示我们的架构，其中卷积消息传递具有x次迭代4.3. 建筑物边缘验证经过几次特征更新迭代后，我们将CNN解码器放入每个节点并输出置信度得分，指示相应的建筑边缘是否为真（见图3）。解码器首先将特征传递到5个Conv-ReLU-BN块中，以将特征转换为64×64×128。然后通过最大池化将特征降采样为2×2×128。最后，特征被展平为512维特征向量，随后是单个完全连接的层以回归置信度得分。1我们不像标准MPN那样在图的边缘保留潜在特征，以考虑内存。v1e12v2e14e23v4e34v3e12e13e34e14e24e23e132801输入图特征初始化卷积消息传递构建边验证构建平面图图3.Conv-MPN架构。给定一个图，DRN编码器为每个节点生成一个特征体积卷积消息传递更新特征量T次。建筑物边缘验证模块使用简单的CNN解码器来估计节点的置信度建筑边缘候选）。4.4. 边缘分类损失我们使用加权二进制交叉熵损失：ΣL=−HlogH<$−λ（1−H）log（1−H<$）。（三）H和H是地面实况和建筑边缘置信度的预测。λ=3用于增加阳性样本的权重。5. 实验我们已经在PyTorch中实现了所提出的系统。学习率初始化为5×10−4，当测试损失在4个epoch内没有减少时，我们将学习率衰减0.8。当测试损失在20个epoch内没有减少时，我们终止训练过程。Conv-MPN是GPU内存密集型的，因为它使用了3D特征卷。除了Conv-MPN（t=3）需要两个TitanX GPU之外，所有实验都使用具有24 G内存的单个NVIDIATitanX GPU。我们将批量大小设置为1，但每8个批次累积梯度并更新参数以抑制噪声梯度。在训练期间，推理图变得太大而不能适应具有许多建筑拐角候选者的大型建筑物的GPU存储器为了训练Conv-MPN（和比较评估中的GNN），我们使用了1215个建筑物，其中最多有15个建筑物角落候选者。在测试过程中，推理需要更少的内存，我们只需将训练好的网络应用于大型建筑物，这在我们的实验中对Conv-MPN效果很好。训练Conv-MPN（t=1）、Conv-MPN（t=2）和Conv-MPN（t=3）大约需要20、30和40小时。5.1. 主要结果图4显示了Conv-MPN的代表性平面图表示。该方法能够恢复曼哈顿几何形状之外的复杂建筑结构，而不依赖于任何手工制作的约束或先验。接下来，我们对五种竞争方法进行比较评估：PolyRNN++ [2] ， PPGNet [36] ， Ham- aguchi et al.[14]，L-CNN [37]和Nauataet al. [21]（见表1和图5）。在这里，我们简要总结了这五种方法。• PolyRNN++以递归的方式跟踪建筑物的外部边界[2]，并生成一个1D多边形循环。• PPGNet [36]使用CNN来检测角点并对其连接进行分类。然而，连接（即，边）分类独立于其他连接，缺乏更高级别的几何推理。• Hamaguchi等人[14]赢得了太空网建筑脚印提取挑战赛[1]。该方法使用CNN以产生建筑物足迹的二进制掩模[14]。我们将分割转换为多边形循环，并使用OpenCV实现的Ramer-Douglas-Peucker算法，阈值为10，以简化曲线。• L-CNN [37]提出了一种端到端的神经网络，可以检测角点并对其连接进行分类。与PPGNet一样，L-CNN也独立地为每条边执行连接分类。• Nauata等人[21]是该问题的当前最新技术，它检测3种类型的几何图元，分类2种类型的成对图元关系，并使用整数规划将所有信息组合成建筑平面图。Nauata等人依赖于具有手工目标和结构约束的整数规划。前4种方法和Conv-MPN试图从示例中学习几何规则或先验。表1示出了Conv-MPN实现了无先验解中的最佳对于角落和边缘指标，Conv-MPN并不总是最好的特别是，L-CNN在边缘度量上略优于Conv-MPN。然而，如图6，L-CNN的图结构经常被破坏，因为边缘是独立估计的。图5和图6表明，区域度量最好地反映了我们对平面图结构的感知质量，其中Conv-MPN使e12 13e编码器（DRNT时间步长ConvNete12损失yv1e12v213e13e34e14e34e14e14e23池化e24e23e24e23v4e34v32802输入GNN零消息Conv-MPN（t=1）Conv-MPN（t=2）Conv-MPN（t=3）地面实况图4.从左到右，输入RGB图像，GNN，零消息，卷积消息传递和地面实况的1，2或3次迭代后的Conv-MPN重建表1. 比较评估：表中显示了边缘置信度阈值设置为0时的精确度和召回率值。五、青色、橙色和洋红色分别表示无先验方法中的第一、第二和第三最佳结果Nauata等人是最先进的并发方法该方法不是无先验的，而是使用具有手工目标和结构约束的整数优化模型角落边缘区域很好召回F1得分很好召回F1得分很好召回F1得分PolyRNN++[2]49.643.746.419.515.217.139.813.720.4PPGNet [36]78.069.273.355.150.652.832.430.831.6Hamaguchi等人[14个]58.357.858.025.422.323.851.036.742.7L-CNN [37]66.786.275.251.071.259.425.941.531.9Conv-MPN（t=3）[Ours]77.980.279.056.960.758.751.157.654.2Nauata等人[21日]91.164.675.668.148.056.370.953.160.8改进.请注意，Conv-MPN落后于Nau- ata等人。[21]在区域F1分数上，这需要在复杂的IP优化公式中手工制作的目标和结构约束。我们想再次强调的是，Conv-MPN自动从示例中学习这些先验和约束，这是一个惊人的壮举，并且与所有其他无先验解决方案相比有了很大的改进。5.2. 消融研究我们验证了Conv-MPN架构的贡献，特别是对1）特征量表示和2）消息传递的影响。图6和图7分别提供了定量和定性比较特征体表示：我们与vanilla GNN，其中我们采用Conv-MPN架构，并将（64×64×32）特征体积替换为512维向量。相应地修改特征初始化、消息传递和线路验证模块，以匹配特征尺寸（有关详细信息，请参阅文档我们在Conv-MPN和GNN上进行一次消息传递，以便进行清晰的比较。图7显示，GNN在边缘召回方面提供了有竞争力的结果，但在其他指标上表现不佳。特别是，性能差距是显着的区域，这需要高层次的几何推理，并证明了我们的功能表示的权力。消息传递：我们比较了两个不进行消息传递的Conv-MPN变体。第一种变体（表示为2803RGB输入PolyRNN++PPGNetHamaguchi等人L-CNNNauata等人零消息Conv-MPN（t=3）地面实况图5.与竞争方法进行比较评价PolyRNN++[2]，PPGNet [36]，Hamaguchiet al.[14]和L-CNN [37]是无先验的现有方法，都利用DNN。Nauata等人”[21]这是一个不平凡的故事。零消息是我们的Conv-MPN的一个变体，没有任何消息传递。Conv-MPN是我们的无先验系统。通过切断节点间连接来交换消息。第二种变体（表示为池化邻居特征的值为0。图7示出了Conv-MPN（t=1）在大多数度量中优于在2804L-CNN PPGNet零消息Conv-MPN（t=3）图6.近距离比较。从左到右，L-CNN[37]，PPGNet[36]，Zero消息和Conv-MPN（t=3）。在缩放区域，我们展示了Conv-MPN可以帮助防止的常见错误。通常情况下，Conv-MPN有助于删除边交点，薄三角形和连接丢失的边。特别地，区域度量中的性能差距再次显著，指示Conv-MPN经由卷积消息传递有效地交换信息图7还显示了Conv-MPN如何在卷积消息传递的多次迭代中改进重构（见图）。（四是质量评价）。从没有迭代到1次和2次迭代，性能改进是一致的和强的，其中每边缘分类器可以被认为是Conv-MPN（t=0）。由于内存限制，Conv-MPN（t=3）是我们训练的最大模型，它显示了最好的结果，其中性能改进开始饱和。5.3. 失败案例Conv-MPN远非完美，图8显示了失败的例子。第一个主要的故障模式来自缺角。如果没有检测到建筑物拐角，Conv-MPN将自动错过所有的事件结构.第二个主要的失效模式是具有30个或更多拐角候选者的大型建筑物，由于内存限制，这些拐角候选者不会出现在训练集中。6. 结论本文提出了一种新的用于结构化户外建筑的消息传递神经网络结构Conv-MPN2805图7.当在范围[0 . 5]内改变边缘置信度阈值时，角点、边缘和区域的查准率和查全率。1，0。8]，增量为0。05.为了清晰起见，我们将精确度和召回率分开绘制。请注意，不同图的y轴不处于相同的比例，以获得更好的可视化效果。图8.故障案例。左边的两个例子由于掩码R-CNN而缺少角点。右边的两个例子显示了复杂的建筑物，Conv-MPN没有很好地推广。重建我们的想法很简单，但很强大。Conv-MPN将与节点相关联的特征表示为特征量，并利用CNN进行消息传递，同时保留标准消息传递神经架构。定性和定量的评估验证了我们的想法的有效性，并证明了显着的性能改进，比现有的无先验的解决方案。主要缺点是大量的内存消耗，这是我们未来的工作之一。当前流行的结构化表示方法是将领域知识作为手工制作的对象或约束注入优化公式中。Conv-MPN从例子中学习所有这些先验知识，然后从单个图像中推断出平面图结构我们相信，本文有可能为结构化几何重建开辟一条新的图神经网络研究路线我们将分享我们的代码和数据，以促进进一步的研究。致谢：本研究部分得到了NSERC发现补助金、NSERC发现补助金加速器补充和DND/NSERC发现补助金补充。这项研究也得到了情报高级研究项目活动（IARPA）通过内政部/内政部商业中心（DOI/IBC）合同号D17 PC 00288的支持。美国政府有权为政府目的复制和分发重印本，尽管上面有任何版权注释。本文中包含的观点和结论是作者的观点和结论，不应被解释为必然代表 IARPA 、DOI/IBC或美国的官方政策或认可（无论是明示还是暗示）政府的2806引用[1] Amazon Web Services（AWS）上的SpaceNet。“数据集”太空网目录。Last modified April 30，2018.https://spacenetchallenge.github.io/http：//www.example.com/pagets/pagetHomePage.html，2018.在线; 2018年10月19日访问。二、四[2] David Acuna，Huan Ling，Amlan Kar，and Sanja Fidler.使用polygon-rnn++对分割数据集进行有效的交互式注释。在IEEE计算机视觉和模式识别会议论文集，第859-868页，2018年。二、四、五、六[3] 詹姆斯·阿特伍德和唐·陶斯利扩散卷积神经网络。神经信息处理系统的进展，第1993-2001页，2016年。2[4] Peter W Battaglia，Jessica B Hamrick，Victor Bapst，Al-varo Sanchez-Gonzalez ， Vinicius Zambaldi ， MateuszMa- linowski，Andrea Tacchetti，David Raposo，AdamSantoro，Ryan Faulkner，et al.关系归纳偏差、深度学习和图网络。arXiv预印本arXiv：1806.01261，2018。二、三[5] Joan Bruna ， Wojciech Zaremba ， Arthur Szlam ， andYann Le- Cun.图上的谱网络和局部连通网络。arXiv预印本arXiv：1312.6203，2013。2[6] Lluis Castrejon，Kaustav Kundu，Raquel Urtasun，andSanja Fidler.使用多边形rnn注释对象实例。在IEEE计算机视觉和模式识别会议论文集，第5230-5238页，2017年。2[7] 郑道明，廖仁杰，菲德勒，尤塔孙.Darnet：用于构建分段的深度活动射线网络。在IEEE计算机视觉和模式识别集，第7431-7439页，2019年。2[8] MichaeülDefferrard，XavierBresson，andPierreVandergheynst.具有快速局部谱滤波的图上卷积神经网络。In D. D.李，M。杉山联合卢克斯堡岛Guyon和R. Garnett，editors，Advancesin Neural Information Processing Systems 29，pages 3844-3852. Curran Associates，Inc. 2016. 2[9] MichaeülDefferrard，XavierBresson，andPierreVandergheynst.具有快速局部谱滤波的图上卷积神经网络。神经信息处理系统的进展，第3844-3852页，2016年。2[10] DavidKDuvenaud 、 DougalMaclaurin 、 JorgeIparraguirre 、 Raf aelBombarell 、 Timoth yHirzel 、 Ala´nAspuru-Guzik和Ryan P Adams。用于学习分子指纹的图上卷积网络神经信息处理系统的进展，第2224-2232页，2015年。2[11] Adam Van Etten，Dave Lindenbaum和Todd M.巴卡斯托。 Spacenet ：遥感数据集和挑战系列。 CoRR ，abs/1807.01232，2018。2[12] 凯文·弗兰斯和郑锦怡使用画布抽屉网络的无监督图像到序列翻译。arXiv预印本arXiv：1809.08340，2018。2[13] Justin Gilmer、Samuel S Schoenholz、Patrick F Riley、Oriol Vinyals和George E Dahl。量子化学的神经信息传递。第34届机器学习国际会议论文集，第1263- 1272页。JMLR。org，2017. 2[14] 滨口隆平和彦坂周平。使用特定尺寸探测器的集合从卫星图像进行建筑物2018年IEEE/CVF计算机视觉和模式识别研讨会（CVPRW），第223IEEE，2018年。二、四、五、六[15] 黄昆、王亦凡、周梓涵、丁天娇、高生华和易马。学习解析人造环境图像中的在IEEE计算机视觉和模式识别会议论文集，第626-635页2[16] 吴嘉业，陈佳成，陈柳. Floor-sp：通过顺序房间最短路径进行平面布置图的逆向cad。在IEEE国际计算机视觉会议（ICCV），2019年。1[17] Thomas N Kipf和Max Welling使用图卷积网络的半监督分类。arXiv预印本arXiv：1609.02907，2016。2[18] ChenLiu ， JiayeWu ， andYasutakaFurukawa.Floornet：一个统一的框架，用于从3D扫描重建平面图。在欧洲计算机视觉会议（ECCV）的会议记录中，第201-217页，2018年。2[19] 刘晨，吴嘉俊，Pushmeet Kohli，和Yasutaka Fu- rukawa.栅格到矢量：重新审视平面布置图转换。在IEEE计算机视觉国际会议论文集，第2195-2203页，2017年。2[20] Diego Marcos ， Devis Tuia ， Benjamin Kellenberger ，Lisa Zhang，Min Bai，Renjie Liao，and Raquel Urtasun.端到端学习深度结构化活动轮廓。在IEEE计算机视觉和模式识别会议论文集，第8877-8885页，2018年。2[21] Nauata Nelson和Furukawa Yasutaka。矢量化世界建筑物：基于基元检测和关系分类的平面图重构。arXiv预印本arXiv：1912.05135，2019。一二四五六[22] Alejandro Newell，Kaiyu Yang，and Jia Deng.用于人体姿态估计的堆叠沙漏网络在欧洲计算机视觉会议上，第483-499页施普林格，2016年。2[23] Mathias Niepert ， Mohamed Ahmed ， and KonstantinKutzkov. 学习图的卷积神经网络在机器学习国际会议上，2014-2023页，2016年。2[24] Charles R Qi， Hao Su ，Kaichun Mo， and Leonidas JGuibas.Pointnet：对点集进行深度学习，用于3D分类和分割。在IEEE计算机视觉和模式识别集，第6522[25] Charles Ruizhongtai Qi，Li Yi，Hao Su，and Leonidas JGuibas. Pointnet++：度量空间中点集的深度层次特征学习。神经信息处理系统的进展，第5099-5108页，2017年。2[26] 任少卿、何开明、罗斯·格尔希克、孙健。更快的r-cnn：利用区域建议网络进行实时目标检测。神经信息处理系统的进展，第91-99页，2015年。3[27] 丹尼尔·里奇，安娜·托马斯，帕特·汉拉汉和诺亚·古德曼。神经引导程序模型：分期偿还2807使用神经网络的过程图形程序的推理神经信息处理系统的进展，第622-630页，2016年。2[28] OlgaRussakovsky ， Jia Deng ， Hao Su ， JonathanKrause ， San- jeev Satheesh ， Sean Ma ， ZhihengHuang ， Andrej Karpathy ， Aditya Khosla ， MichaelBernstein ， et al. 图像网大规模视觉识别挑战。International Journal of Computer Vision，115（3）：211-252，2015. 3[29] Ke Sun，Bin Xiao，Dong Liu，and Jingdong Wang.用于人体姿势估计的深度高分辨率表示学习。在IEEE计算机视觉和模式识别会议论文集，第5693-5703页2[30] 东来香韩宝和亚瑟·谢赫单眼总夺获：在野外摆出脸、身体和手的姿势。在IEEE计算机视觉和模式识别会议论文集，第10965-10974页2[31] Bin Xiao，Haiping Wu，and Yichen Wei.用于人体姿态估计和跟踪的简单基线。法律程序中欧洲计算机视觉会议（ECCV），第466-481页，2018年。2[32] Keyulu Xu，Weihua Hu，Jure Leskovec，and StefanieJegelka.图神经网络有多强大？在2019年国际学习代表会议上。2[33] Fisher Yu，Vladlen Koltun，and Thomas Funkhouser.扩张的剩余网络。在IEEE计算机视觉和模式识别，第4723[34] ShanxinYuan，GuillermoGarcia-Hernando，BjoürnStenger ， Gyeongsik Moon ， Ju Yong Chang ，Kyoung Mu Lee ， Pavlo Molchanov ， Jan Kautz ， SinaHonari，Liuhao Ge，et al.基于深度的3D手姿态估计：从目前的成就到未来的目标。In Proceedings of theIEEE Conference计算机视觉和模式识别，第2636-2645页，2018年。2[35] Huayi Zeng，Jiaye Wu，and Yasutaka Furukawa.住宅建筑的神经程序重建。在欧洲计算机视觉会议（ECCV）的Proceedings中，第737-753页，2018年。2[36] 张子恒、李正新、毕宁、郑佳、王金磊、黄昆、罗伟新、徐燕宇和高胜华。Ppgnet：学习点对图的线段检测。在IEEE计算机视觉和模式识别会议论文集，第7105-7114页二四五六七[37] Yichao Zhou，Haozhi Qi，and Yi Ma.端到端线框解析。在IEEE计算机视觉国际会议论文集，第962-971页，2019年。二四五六七[38] Christian Zimmermann和Thomas Brox学习估计三维手构成从单一的rgb图像。在IEEE计算机视觉国际会议论文集，第4903-4911页，2017年。2

下载后可阅读完整内容，剩余1页未读，立即下载