基于顺序最短路径的自动平面图重建方法Floor-SP

121 浏览量更新于2023-10-12 收藏 1.37MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

1Floor-SP：基于顺序最短路径陈家成1刘晨2吴嘉业2古川康孝1西蒙弗雷泽大学2华盛顿大学圣。路易{jca348，furukawa}@ sfu.ca{chenliu，jiaye.wu}@ wustl.edu图1.所提出的系统，被称为Floor-SP，以对齐的全景RGBD扫描作为输入，找到房间段，解决优化问题以将平面图图重建为多个多边形循环（每个房间一个），并通过简单的后处理算法将它们合并成2D图。优化是本文的技术贡献，它采用逐房间坐标下降策略，依次求解最短路径问题，以优化房间结构。摘要本文提出了一种新的方法，自动平面图重建RGBD扫描，一个主要的里程碑，在室内测绘研究。该方法，被称为Floor-SP，制定了一个新的优化问题，其中房间坐标下降顺序解决最短路径问题，以优化布图结构。目标函数由深度神经网络引导的数据项、鼓励相邻房间共享角落和墙壁的一致性项以及模型复杂性项组成。与大多数其他方法不同，该方法不需要角/边缘基元提取。我们已经对527套公寓或房屋的生产质量RGBD扫描进行了定性和定量评估表明，与当前最先进的技术相比，性能显著提高。请参考我们的项目网站http：jcchen.me/ floor-sp/获取代码和数据。1. 介绍建筑平面图在设计、理解和重塑室内空间方面起着至关重要的作用。从原始传感器数据自动重建平面图是室内测绘研究的一个重要里程碑。其核心技术挑战在于壁图结构的推理，其拓扑结构是未知的，并且每个示例都是变化的。计算机视觉在图形推理方面取得了显著的进展，例如，人类姿势估计。[30]手，手，手。不幸的是，成功仅限于固定已知拓扑的情况（例如，人有两条胳膊）。具有未知变化拓扑的图的结构推断仍然是一个开放的问题。图形重建的一种流行方法是图元检测和选择[11，27，22]，例如，检测角点，选择角点的子集以形成边缘，以及选择边缘的子集以形成区域。这种自下而上的过程的主要问题是它不能从早期阶段的单个假阴性中恢复（即，缺失的识别符）。随着原始空间的自由度呈指数级增长，任务变得越来越困难，特别是对于大多数现有方法无法处理的非曼哈顿场景[11，2，21，20]。本文试图通过三个关键思想在平面图重构领域取得突破。• 首先，我们通过实例语义分割技术（我们使用Mask-RCNN [12]）从房间分割开始。房间分割将平面布置图推断减少到多个多边形回路的重构中，每个房间一个多边形回路。这种减少使我们能够将平面图重建公式化为由房间建议引导的多个环路上的声能优化。• 其次，我们采用房间坐标下降策略优化目标函数。通过利用房间拓扑结构是一个简单循环的事实，我们的公式通过依次逐个解决每个房间的最短路径问题来找到（接近）最优的图结构，同时强制执行与其他房间的一致性。26612662• 第三，我们利用深度神经网络来评估优化问题的数据项，测量输入传感器数据的差异。数据项与ad-hoc相结合：1）一致性项，使相邻房间共享房间边界处的拐角和墙壁，以及2）模型复杂性项，惩罚图中的拐角数量。我们已经对527个公寓或房屋的生产质量RGBD扫描评估了所提出的方法我们的方法比目前最先进的方法有了显著的改进[20]。我们参考我们的项目网站http：//jcchen.me/floor-sp/获取代码和数据。2. 相关作品我们讨论两个领域的相关工作：图形重建和室内扫描数据集。图重构：图结构推理一直是计算机视觉中的一个热门研究领域，例如，推断人体姿势[3]或类别的语义关系[14，28]。在这些问题中，图拓扑被定义在标签空间上，对所有实例（例如，头总是连接到身体）。在这里，我们专注于图推理问题的背景下，重建，拓扑结构各不相同的实例。房间布局估计从单个图像推断建筑特征线的图形，其中节点是房间拐角，边缘是墙壁边界。大多数方法都假设一个3D盒子房间，以限制2D图像中可见的房间布局的拓扑变化对于超出盒子形状的房间，应用动态规划（DP）来搜索最佳房间结构[8，9]。DP类似地用于通过将其拓扑限制为环路来求解布图规划[2]。自底向上处理是一种流行的图形重建方法，其中检测低级别的图元（如角点），然后选择这些图元以形成更高级别的图元（如边缘或区域）。提出了基于DNN的连接检测器用于平面图图像矢量化[21]，其中连接指示曼哈顿框架中的入射边缘方向。利用结点信息，通过整数规划（IP）来推断边类似地，Huanget al.[16]使用DNN来检测由一组入射边缘方向表示的连接点，并通过人工场景的单图像线框表示来推断边缘。虽然许多先前的工作利用RGBD扫描/点云进行高质量室内重建[17，19，23，20]，但FloorNet [20]是在大规模室内基准上测试的楼层平面重建任务FloorNet在自下而上的过程中结合了DNN和IP，但它有三种主要的故障模式。首先，正如任何自下而上的过程中，在检测阶段丢失的角自动导致在最终模型中丢失墙壁和房间。其次，错误的候选图元可能导致重建无关的墙壁和房间。第三，为了能够使用强大的IP，FloorNet需要将解决方案空间限制在曼哈顿场景。Ikehata等人的结构化室内建模。[17]是我们工作的灵感来源，它从房间分割开始，然后解决最短路径问题，以重建房间形状，然后是房间合并和房间添加。虽然他们的系统是一个序列的室内建模，我们的方法制定了一个声音能量最小化的问题，以恢复平面布置结构。室内扫描数据集：经济实惠的深度传感硬件使研究人员能够构建许多室内扫描数据集。ETH3D数据集包含16个多视图立体室内扫描[24]。ScanNet数据集[6]和SceneNN数据集[15]捕获各种室内场景。然而，他们的大多数扫描只包含一个或两个房间，不适合平面图重建问题。Matter-port 3D [4]为90个豪华住宅构建高质量的全景RGBD图像2D-3D-S数据集[1]通过使用相同的Matterport系统提供了6个办公空间的大规模室内扫描。最后，一个大规模的合成数据集SUNC [26]提供了各种室内场景。对于平面图重建任务，FloorNet [20]提供了具有完整平面图注释的基准以及来自155个住宅单元的智能手机的相应RGBD视频本文利用生产质量的全景RGBD扫描527房屋或公寓的平面图注释。3. Floor-SP：系统概述Floor-SP在三个阶段中将对齐的全景RGBD图像转换为平面布置图：房间分割、房间感知的平面布置图重构和环路合并（参见图1B）。2）的情况。本节提供了系统概述，但仅提供了最少的详细信息。对齐的全景RGBD扫描首先转换为2D点密度/法线图，这是Floor-SP的输入。与FloorNet [20]不同，我们专注于墙结构，其中门/窗，图标和房间语义可以添加到适当的墙结构中。房间分割：将输入的全景扫描转换为自上而下视图中的4通道256×256点密度/法线图（见第（六）。我们利用实例语义分割技术（Mask R-CNN [12]）来找到给定4通道图像的房间段。房间分段通过提供具有粗略形状的房间提议为平面布置图重建建立了良好的基础未知的数量和位置的角落）;和2）墙是2663图2.系统概述：（左）Mask-RCNN从由点密度和平均表面法线组成的自上而下的投影图像中找到房间段（光栅），使我们能够将平面图重建为多个房间循环。（中）房间坐标下降通过最小化数据、一致性和模型复杂度项的总和来逐个优化矢量化的房间结构。（右）简单的图合并操作将循环组合成布局图结构。并不是所有房间都共用的像素数。房间感知平面图重建：给定一组ΣE（L）=λ EC（p）+房间段和输入点密度/法线地图，我们制定了一个优化问题，重建地板-数据i1p∈C（Li）ΣΣ数据EI平面图为多个多边形循环，每个房间一个。深度神经网络导出目标中的数据项我们p∈E（Li）λ2E数据（p）+λ3E数据（p）。提出了一种新的空间坐标下降算法直接优化了角落的数量和位置，C数据（p）是在像素p处放置角的惩罚解决最短路径问题。循环合并：简单的图形合并操作将多个多边形循环组合成最终的布局图。房间感知平面图重建是技术（见图3a），因此，在所有角点上求和elC（Li）在Li上。惩罚被定义为一减去逐像素角点似然。我们使用扩张残差网络（DRN）[29]从输入点密度/法线映射估计角点样- lihood映射。核心的文件，其中节。第四，明确问题所在--E数据（p）是在像素上放置边缘的惩罚mulation和Sect.5给出了优化算法。房间分割和循环合并是基于现有的技术，其中节。6提供了它们的算法细节和其余的系统规范。p. 该术语定义为1减去像素边缘可能性（见图）3b），在沿着L1的所有边缘像素E（L1）上求和。我们使用Bresenham相同的DRN从输入点密度/法线图估计边缘似然。4. 房间感知的平面图重建我数据（p）也是在边缘像素上求和的惩罚来自Mask R-CNN的房间分割（Ri）允许我们将平面图推理减少到多个循环（Li）的重构中，每个循环用于一个房间。L1被定义为整数坐标处的像素序列，其形成具有环拓扑的多边形曲线我们的问题是最小化关于多边形回路集合L的以下目标：其强制Li不通过房间段Ri如果像素属于任何房间段，则该项是大常数，否则为0。一致性项：Econsis是房间方向的高阶势，鼓励循环在房间边界处保持一致（即，共享角和边）。我们将惩罚定义为所有循环的角（或边）一起使用的像素数例如两个ΣE数据（Li）+E一致性（L）+ΣE型（Li），如果角点彼此靠近，则该术语建议将它们移动到同一像素，以便仅施加一次惩罚Li∈LLi∈LEconsis（L）=Σ[λ41C（p，L）]+Σ[λ51E（p，L）]条件是Li是内部包含Ri的环。注意pp房间具有任意数量的角（即，自由度），其必须由算法优化。数据项：E数据是房间方向的一元电位，测量与集合上的输入传感器数据的差异• E• E• E2664第一项1C（p，L）是指示函数，如果像素（p）是至少一个环的角，则其为1。类似地，第二项是边缘的指示函数看到图3为玩具示例的示意图。2665本节解释1）最短路径问题的简化;2）满足安全壳约束; 3）两种加速近似方法。最短路径问题减少：减少过程很简单，因为我们的成本函数是像素惩罚和角点数量的总和。不失一般性，假设我们优化L1，同时修复其他循环。我们的优化问题等价于求解R1的最短路径问题，每个边（e）的权重定义如下（推导参见补充文档）：λ1Cp∈C（e） 2E数据（p）+伊芙· 伊芙λ2E数据（p）+λ3E数据（p）+p∈E（e）Σp∈C（e）λ4（1−1C（p，L\{L1}））+图3. 数据和一致性术语的说明。EC和Σ λ（1−1（p，L \ {L}））+λ。数据E第五季第十六集E数据是基于角点和边缘似然图定义的。蓝色像素表示这些玩具示例中的较低成本。Econsis计算房间角落和房间边缘使用的像素数。当相邻的房间共享角和边时，如（c）所示，Econsis下降。p∈E（e）由于符号的滥用，C（e）表示在e的端点处的两个像素，E（e）表示通过Bresenham的线算法获得的沿e的像素的集合模型复杂度项：E模型是模型的复杂性不包括L1的循环的集合。惩罚，计算我们的循环中的角的数量，优先紧凑的形状。E模型（L i）= λ6{L i中的角数}。λ？是定义惩罚项的相对权重的标量我们发现我们的系统对这些参数具有鲁棒性，并在整个实验中使用以下设置：λ1=0。2，λ2=0。2，λ3=100。0，λ4=0。2，λ5=0。1，λ6= 1。0的情况。5. 顺序房间最短路径我们的优化策略的灵感来自于先前的工作，该工作解决了最短路径问题并将平面图重建为循环[2]。该公式将每个像素视为图的节点，将目标编码为边权重，并将最短路径视为循环。我们的问题解决了多个房间的多个循环。我们设计了房间坐标下降策略，通过将房间坐标下降步骤减少为最短路径问题，依次逐个优化房间结构。虽然该算法对处理顺序是鲁棒的，但我们以房间面积的递增顺序（即，首先处理较小的房间），以便在给定相同输入的情况下得到固定的结果。在我们的实验中，优化运行了两轮。安全壳约束满足：最短路径是强大的公式，搜索最佳数量和角落的位置有一个警告：需要附加的约束来避免平凡的解决方案（即，空循环）。我们使用类似于先前工作[2]的启发式来实现这个约束：我们参考补充文件中的详细信息，并在此总结该过程。首先，我们从用于数据项的同一个角点似然图中找到角点候选（见图2）。4）.其次，我们查看边缘似然图以识别形成循环的起始边缘的良好角对。第三，我们绘制起始线，该起始线从房间遮罩（Ri）开始并且在起始边缘的中点处垂直地穿过起始边缘。最后，我们移除与起始线相交的所有边，以确保路径必须围绕Ri。请注意，将开始边缘固定为循环的一部分会破坏我们坐标下降步骤的局部最优性，但在实践中效果很好，因为以高置信度识别一个壁段并不难边界框近似：我们在修剪节点和边时进行近似，以减少最短路径算法（SPA）的计算开销。我们限制了SPA的域，因为在整个图像域上运行它来重建一个房间是浪费的。给定一个房间掩码Ri，我们将二进制膨胀应用10次以扩展2666图4.我们为每个房间解决最短路径问题，其中成本函数被编码为边权重。为了避免琐碎的解决方案（即，空图）并强制路径绕过粗糙房间段（Ri），我们首先识别作为具有高置信度的房间形状的一部分接下来，我们画一条（红色）垂直的起始线来分割域。我们禁止越过起始线，为通过Ri分配非常高的惩罚，然后求解在起始边的两个端点掩码，并找到其轴对齐的边界框与5像素的利润，其中我们解决SPA。主导方向近似：Floor-SP通过允许每个房间多个曼哈顿帧而超越常规曼哈顿假设。我们训练相同的DRN架构，以每个像素10度的增量来估计墙壁方向的可能性。我们执行简单的统计分析以提取四个曼哈顿帧（即，八个方向），然后将其子集分配给每个房间。我们只允许沿着选定的支配方向的边缘，对离散化误差具有一定的容差（详见补充文档）。6. 系统细节输入处理：给定一组全景RGBD扫描，其中Z轴与重力方向对齐，我们计算水平面上点的紧密轴对齐边界框。我们将矩形扩大2。在四个方向上的每个方向上，应用非均匀缩放到256×256像素网格中，并计算每个像素中点密度是落在像素内的3D点的数量，我们将其线性重新缩放到[0.0，1.0]，以便最高密度变为1。0的情况。点法线是与像素相关联的3D点的平均表面法线向量房间分割：我们使用公开可用的Mask R-CNN实现[7]，使用默认的超参数，只是我们将检测阈值从0.7降低到0.2。给定来自Mask R-CNN的片段，我们应用二进制侵蚀操作进行2次迭代，具有8个连接的邻域，以获得房间片段（Ri）。房间感知平面图重建：要估计像素，明智的似然角，边缘和边缘方向，我们使用官方实现的扩张残差网络[29]，它产生32×32的特征图。为了以与输入相同的分辨率产生输出，我们添加了3个额外的残差块层[10]，其中转置卷积的步幅为2，以达到256×256的分辨率。对于角点似然监督，我们将每个地面真实角点渲染为7×7磁盘。对于边缘似然度和壁向监督，我们绘制了宽度为5像素的边缘掩模和方向信息。损失是二进制交叉熵，学习率是1 e-4。Dijkstra循环合并：我们使用简单的图形合并操作将房间循环转换为最终的平面图图形结构。更具体地说，我们将一组连续的共线线段表示为线段组。我们反复识别5个像素内的一对平行段组，并在合并角点的同时将它们捕捉到中间点的新段组在将边缘合并应用于所有兼容对之后，我们合并3个像素内的角点。7. 实验我们已经评估了所提出的系统对527套对齐的全景RGBD扫描。平均数1)点密度/正常图像的输入3D点，2）注释中的角，3）注释中的墙段，和4）注释中的房间分别为432、552、28.87、35.88和7.73。在4072间客房中，有489间客房没有遵循该单位的主要曼哈顿结构图5显示了我们数据集中的四个例子。527个单元被分成433个单元和94个单元，分别用于训练和测试。我们有意使测试集更具挑战性，以进行评估：94个测试单元中有48个包含具有挑战性的非曼哈顿结构，667个测试室中有199个遵循非曼哈顿几何结构。我们在Python中实现了所提出的系统，同时使用PyTorch 作为 DNN 库。我们使用的工作站配备了NVIDIA 1080Ti与12GB GPU内存。我们训练了70个epoch的Mask-RCNN，批次大小为1，以及35个epoch的DRN，批次大小为4。每个DNN模型的训练最多需要一天时间。在测试时，处理一个公寓/房子大约需要5分钟瓶颈是最短路径问题（CPU密集型）的图的构建。7.1. 定性评价图6将Floor-SP与当前最先进的FloorNet [20]和我们系统的变体进行了比较。Floor- Net遵循自下而上的过程，首先检测拐角，然后使用可扩展编程来找到它们的有效连接。FloorNet有三种故障模式：1）由于在第一个拐角处缺少拐角而缺少房间-2667图5.我们的数据集提供了527套房屋/公寓的生产级全景RGBD扫描。我们将每次扫描从自上而下的视图转换为点密度/法线图，这是我们系统的输入。我们将平面布置结构标注为2D多边形图。请注意，对于可视化点密度/法线贴图（中间列），强度编码点密度，色调/饱和度编码平均表面法线的2D水平分量。表1.主要量化评价结果。青色、橙色、洋红色代表前三个条目。方法角落边缘房间房间++检测步骤; 2）来自无关拐角检测的无关房间;以及3）破碎的非曼哈顿结构，由于整数规划中的过量搜索空间，这变得具有挑战性。右侧三列显示了建议的Floor-SP的变体。左边没有一致性项，并且在先前的工作[2]中用ad-hoc成本函数替换了基于DNN的数据项。我们的整体配方保证在每个检测到的房间段进行房间重建，产生合理的结果。在添加我们的基于DNN的数据项E数据（中间）时，每个房间的结构得到了显着改善。然而，房间边界的不一致性往往是显而易见的最后，通过添加一致性项（右），我们看到具有一致的共享房间边界的干净的平面图结构图7示出了在多轮上的房间方向坐标下降的效果。红色椭圆表示导致房间重叠或孔洞的折叠结构，在第二轮优化后重新解决。7.2. 定量评价我们遵循FloorNet [20]并定义了以下四个定量评估指标：角精度/召回：我们声明，如果在10个像素内存在地面实况房间角，则角被成功地重建。当在单个地面实况角点周围检测到多个角点时，我们只将最重要的角点视为正确的角点，并将其他角点视为误报。边缘精确度/召回率：我们声明，如果图的两个端点通过上述角测试并且对应的边缘符合地面实况，则图的边缘被成功重建。房间精确度/召回率：如果1）它不与任何其他房间重叠，并且2）在地面实况中存在一个房间，其交叉-联合（IOU）得分超过0.7，则我们宣布该房间成功重建。请注意，此度量不考虑角和边的定位和共享。Room++ precision/recall：我们声明，如果房间是连接的（即，共享边缘）到如地面实况中的成功重建的房间的正确集合，除了通过上述两个房间条件之外。表1显示了主要的定量评价。低级原语上的精度度量（即，角和边）预处理召回预处理召回预处理召回预处理召回Floor Net [20]95.076.694.876.881.272.142.337.5Ours（w/oEdata，Econsis）84.480.482.379.875.161.323.322.0Ours（w/oEconsis）93.982.389.281.283.881.749.448.5我们的（第一轮坐标下降）94.682.889.481.783.981.849.548.7我们的（第二轮坐标下降）95.182.290.281.184.783.051.450.42668图6.与FloorNet [20]和我们方法的变体进行定性比较。我们选择非曼哈顿的硬例子在这里说明我们数据集中的重建挑战。对于Floor-SP变体的重建，房间颜色由来自Mask R-CNN的相应房间段对于地面实况和FloorNet，颜色基于房间类型。对于FloorNet是高的，因为该任务不需要高级结构推理并且大多数拐角是容易的拐角（例如，Manhattancorners）。另一方面，它们的召回指标即使对于低级别的特征也很低，因为一些房间角落由于遮挡而没有足够的3D点，其中基于DNN的角落检测失败了。Floor-SP通过顺序的房间优化过程恢复这些具有挑战性的角落。在房间级指标上，Floor-SP始终优于FloorNet。此外，数据和一致性项的添加改进了房间级度量。最后，房间坐标下降进一步提高了2669性能所有94个测试示例的定量结果和可视化见补充文件。图7.多轮的坐标下降修复了具有挑战性的布局结构中的错误。顶行示出了坐标下降优化的第一轮之后的结果，并且底行示出了第二轮之后的结果我们还显示了每轮后的总能量。相应的地面实况注释见图1. 六、图8.典型的故障模式。顶部是地面真值符号，底部是每个示例的结果。我们的系统在处理复杂场景和非曼哈顿建筑时仍然会出错7.3. 讨论Floor-SP为曼哈顿结构提供近乎完美的结果。大多数失败集中在非曼哈顿案件。从数量上看，我们的Room++指标略高于50。然而，我们想指出的是，我们的重建并不是非常糟糕，即使在非常具有挑战性的情况下，房间++指标很差。看看图中的第一个例子。8. Room++的查准率和查全率在我们的重建中都是0，而重建看起来相当合理。如数字所示，原因有1)一个非曼哈顿的小房间在预处理步骤中主导方向错误，导致Floor-SP无法恢复，IOU测试失败; 2）小细节如凹结构难以保留，房间未通过IOU测试; 3）Mask R-CNN的房间分割出错图9.标准的角点检测很容易出错（红色圆盘）。Mask R-CNN产生不精确的光栅房间段（白色遮罩）或错过整个房间（最右侧的示例）。Floor-SP使用优化来鲁棒地解决角放置在顶部，橙色的多边形显示了我们对一个房间的重建。底部显示了相应的地面实况。一个复杂案件的房间数量，这也是不可能恢复的。一旦一个房间失败，所有相邻的房间在Room++指标中自动失败，导致本例中的零精度和召回率。在图9中，我们进一步分析了我们的方法的鲁棒性。非最大值抑制的角点检测往往会产生噪声，实例分割网络生成的房间分割也不精确。Floor-SP不是直接使用这些基元检测，而是制定能量最小化问题来解决布图角的数量和位置，并且对这两种类型的错误具有鲁棒性然而，当房间实例分割在房间的数量上出错时（如图1中的最后一个示例），9），我们的系统不能恢复，但产生近似的室内结构与错误的房间分离。这个错误在图2中的两个例子中也可以观察到。8.一个未来的研究是重新覆盖在房间分割阶段的错误，以产生更准确的平面图。我们还要注意，我们的系统的输入是来自自顶向下视图的单点密度/正常图像我们已经通过将点投影到2D图像上而丢弃了3D信息，如在第12节中所描述的。6.我们没有使用高分辨率全景RGB图像，这些图像在数据集中可用，可以使系统像FloorNet一样更强大[20]。我们相信，这篇论文在室内测绘研究中树立了一个重要的里程碑.所提出的系统产生引人注目的布局重建结果的生产质量具有挑战性的场景在大量。我们在项目网站上公开分享代码和数据，以促进进一步的研究。鸣谢：本研究部分由国家科学基金会资助 IIS1618685，NSERC发现补助金，NSERC发现补助金加速器补充和DND/NSERC发现补助金补充。我们感谢北科（www.ke.com）提供的3D房屋扫描和注释。2670引用[1] Iro Armeni，Ozan Sener，Amir R Zamir，Helen Jiang，Ioannis Brilakis，Martin Fischer，and Silvio Savarese.大规模室内空间的三维语义解析在IEEE计算机视觉和模式识别会议，2016年。[2] Ricardo Cabral和Yasutaka Furukawa从图像的分段平面和紧凑布局重建。 IEEE计算机视觉与模式识别会议（CVPR）IEEE，2014。[3] 曹哲、托马斯·西蒙、魏世恩和亚瑟·谢赫。利用局部仿射场进行实时多人二维姿态估计。在IEEE计算机视觉和模式识别会议（CVPR），2017年。[4] 天使 X 放大图片作者： Angela Dai ， Thomas A.Funkhouser ， Ma- ciej Halber ， Matthias Nießner ，Manolis Savva，Shuran Song，Andy Zeng，and YindaZhang.Matterport3d：室内环境中rgb-d数据的学习。2017年[5] Yu-Wei Chao，Wongun Choi，Caroline Pantofaru，andSil-vio Savarese.使用几何和语义线索对高度杂乱的室内场景进行布局估计。图像分析与处理国际会议（ICIAP），2013年。[6] Angela Dai、Angel X Chang、Manolis Savva 、MaciejHal- ber 、 Thomas Funkhouser 和 Matthias Nießner 。Scannet：室内场景的丰富注释3D重建。在IEEE计算机视觉和模式识别会议（CVPR），2017年。[7] pytorch-mask-rcnn. https://github.com/multimodallearning/pytorch-mask-rcnn.[8] 亚历克斯·弗林特，克里斯托弗·梅，大卫·默里和伊恩·里德。建筑物内部改造的动态规划方法。欧洲计算机视觉会议（ECCV），2010年。[9] 亚历克斯·弗林特大卫·默里和伊恩·里德使用单眼、立体和 3d 特征的曼哈顿场景理解。 IEEEInternationalConference on Computer Vision（ICCV），2011年。[10] Huan Fu ， Mingming Gong ， Chaohui Wang ， KayhanBat- manghelich，and Dacheng Tao.用于单目深度估计的深度有序回归在 IEEE计算机视觉和模式识别会议（CVPR），2018。[11] 放大图片创作者： Brian Curless， Steven M. Seitz 和Richard Szeliski。曼哈顿世界立体声。在IEEE计算机协会计算机视觉和模式识别会议（CVPR），2009年。[12] Kai m ingHe ， Geo r giaGkioxari ， PiotrDol la'r ，andRossB. 娘娘腔。面具 R-CNN 。 IEEEInternationalConference on Computer Vision（ICCV），2017年。[13] Varsha Hedau、Derek Hoiem和David A.福赛斯整理杂乱房间的空间布局。在 IEEE 国际计算机视觉会议（ICCV），2009年。[14] Hexiang Hu，Guang-Tong Zhou，Zhiwei Deng，ZichengLiao，and Greg Mori.使用标签关系学习结构化推理神经网络。在IEEE计算机视觉和模式识别会议（CVPR），2016年。[15] Binh-SonHua 、 Quang-HieuPham 、 DucThanhNguyen 、 Minh-Khoi Tran 、 Lap-Fai Yu 和 Sai-KitYeung。Scenenn：带有注释的场景网格数据集。2016年第四届[16] 黄昆、王亦凡、周梓涵、丁天娇、高生华和易马。学习解析人造环境图像中的线框。在IEEE计算机视觉和模式识别会议（CVPR），2018。[17] 池畑聪，杨航，古川康孝。结构化室内建模。IEEEInternationalConferenceonComputerVision（ICCV），2015年。[18] Chen-YuLee ， VijayBadrinarayanan ， TomaszMalisiewicz，and Andrew Rabinovich. Roomnet：端到端的房间布局估计。 IEEEInternational Conference onComputer Vision（ICCV），2017年。[19] Minglei Li，Peter Wonka，and Liangliang Nan.曼哈顿-从点云重建世界城市。欧洲计算机视觉会议（ECCV），2016。[20] ChenLiu ， JiayeWu ， andYasutakaFurukawa.Floornet：一个统一的框架，用于从3D扫描重建平面图。在欧洲计算机视觉会议（ECCV），2018。[21] 刘晨，吴嘉俊，Pushmeet Kohli，和Yasutaka Fu- rukawa.栅格到矢量：重新审视平面布置图转换。IEEEInternationalConferenceonComputerVision（ICCV），2017年。[22] 放大图片作者：Aron Monszpart ，Nicolas Mellado ，Gabriel J. Brostow和Niloy Jyoti Mitra。再现：用有规律的平面排列重建人造场景。ACM事务处理图表，34：103：1[23] 南亮亮和彼得·旺卡。多边形拟合：多边形表面重建从点云 .IEEEInternational Conference on Computer Vision（ICCV），2017年。[24] ThomasScho¨ps ， JohannesL.Schoünberger ， SilvanoGalliani，Torsten Sattler，Konrad Schindler，MarcPollefeys，and An- dreas Geiger.具有高分辨率图像和多相机视频的多视图立体基准。在IEEE计算机视觉和模式识别会议（CVPR），2017年。[25] Alexander G Schwing，Tamir Hazan，Marc Pollefeys和Raquel Urtasun。用于三维室内场景理解的高效结构化预测在IEEE计算机视觉与模式识别会议（CVPR）上。IEEE，2012。[26] 宋舒然，余菲雪，曾志祥，天使X Chang，ManolisSavva，and Thomas A.放克豪瑟从单个深度图像的语义场景完成2017 年 IEEE计算机视觉和模式识别会议（CVPR），2016年。[27] 肖健雄和古川康孝。重建世界International Journal ofComputer Vision，110（3）：243[28] Danfei Xu，Yuke Zhu，Christopher B Choy，and Li Fei-Fei.通过迭代消息传递生成场景图在IEEE计算机视觉和模式识别会议（CVPR）上，2017年。[29] Fisher Yu，Vladlen Koltun，and Thomas A.放克豪瑟扩张残差网络。在IEEE计算机视觉和模式识别会议（CVPR），2017。2671[30] 袁善新，叶琪，比约恩·斯登格，西丹·杰恩，金泰均.大块头2 2m基准：手部姿势数据集和最先进的分析。在IEEE计算机视觉和模式识别会议（CVPR），2017年。

下载后可阅读完整内容，剩余1页未读，立即下载