多边形提取和矢量化算法

62 浏览量更新于2023-10-24 收藏 4.16MB PDF 举报

对象提取

图像处理

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

1用低复杂度多边形近似图像中的形状Muxingzi LiFlorent LafargeUniversite´ Coˆte d’Azur, Inriafirstname. inria.fr雷诺·马莱Valeo.ai LIGM，Ecole des Ponts，Uni v Gustav e Eif fel，CNRS，Marne-la-Valle' e，法国Renaud. enpc.fr摘要我们提出了一个算法提取和矢量化的多边形图像中的对象。从多边形划分，过度分割成凸细胞的图像出发，该算法细化的几何分区，同时标记其细胞的语义类。结果是一组每个多边形捕获图像中的对象。一个配置的质量是由能量来衡量的，该能量考虑到输入数据的保真度和输出多边形的复杂性。为了有效地探索网格空间，我们对多边形分区的单元格进行串联的拆分和合并操作。探索机制由优先级队列控制，优先级队列对最有可能降低能量的操作进行排序。我们展示了我们的算法在不同类型的场景中的潜力，从有机形状到人造物体，通过楼层地图，并证明了它的效率相比，ex-bottom矢量化方法。1. 介绍提取图像中的对象传统上以像素尺度操作，一个对象被表示为一组像素。这种分辨率相关的表示通常不适合于终端用户。在许多应用场景中，如城市地图或草图，对象需要捕获更紧凑和可编辑的矢量表示。特别地，具有浮动坐标的多边形允许自由形状的近似，例如，有机对象，以及分段线性结构的精细描述，例如，建筑物和许多其他人造物体。我们考虑的任务，捕捉图像中的对象的多边形与三个目标。首先，保真度：输出多边形应该很好地近似输入图像中的对象轮廓。第二，复杂性：输出多边形应该由少量的边组成，以提供紧凑和可编辑的表示。最后，几何guarantees：输出多边形应该是交叉自由，封闭的，可能与洞，并形成一个图像分区。捕捉物体轮廓的最简单方法作为一个多边形是矢量化的像素链表示对象轮廓[9，12，38]。虽然多边形的复杂性可以容易地控制，但是这些简化过程没有考虑输入图像中包含的结构信息。因此，输出多边形通常是不精确的，通常具有不精确地适合对象轮廓的边缘最近关于将图像分割成多边形单元的工作[1，3，11，16]表明，从这些分区对单元进行分组可以产生比传统矢量化方法更准确的结果。然而，该策略遭受不精确的划分，通常具有重叠两个不同对象的一些多边形单元。该领域的现有工作仅集中于合并多边形单元，并且省略了分裂操作的必要性以提供更精确的结果。在这项工作中，我们提出了一个算法来捕获对象的紧凑浮动多边形。受几何处理中的网格变形技术的启发，其主要思想是细化不精确多边形partition的几何形状，同时通过语义类标记每个单元。我们的算法依赖于两个关键贡献。首先，我们设计了一个能量函数来衡量一个多边形分区的质量其次，我们提出了一个有效的优化方案，以尽量减少能源。我们探索的解决方案空间的多边形分区内的分裂和合并细胞。该机制由优先级队列控制，优先级队列对最有可能降低能量的操作进行排序。我们展示了我们的方法在不同类型的场景中的潜力，从有机形状到人造物体，通过平面图和线条画草图，并显示其效率相对于现有的矢量化方法。2. 相关工作我们区分四个家庭现有的，相关的方法。矢量化管道。最流行的策略是通过像素链提取目标轮廓，然后将其简化为多边形。轮廓提取86338634可以通过各种方法执行，例如Grabcut [33]，超像素分组[23]或流行的对象显着性检测算法[7，24，37]。随后的简化步骤传统上依赖于Douglas-Peucker算法[38]或简化Delaunay三角剖分的机制[12，9]。由于这些算法只测量高度复杂多边形的初始配置的几何偏差，因此它们的输出很容易偏离对象轮廓，导致实际中的高精度损失。基于几何图元的方法。另一种策略是检测输入图像中的几何图元，如线段，并将它们组装成封闭的轮廓。组装步骤可以通过分析线段之间的邻接图[34]或通过间隙填充推理[39]来执行。然而，这些算法不能保证输出多边形是无相交的。Polynomial马尔可夫随机场[22]是直接从图像中采样多边形的替代方案。但是这种模型在实际中模拟起来非常慢，并且只能在简单的合成图像上运行。 Delaunay 点过程 [14] 允许在Delaunay三角剖分内对顶点进行采样，同时将三角剖分面分组为多边形。NN架构。Polygon-RNN [5]及其改进版本[2]提供了一种半自动的多边形对象注释。这些模型产生的多边形可能有自相交和重叠，更不用说因为RNN解码器在每个时间步预测下一个顶点时只考虑三个前面的顶点。相比之下，Poly-CNN [19]是自动的，避免了自相交。然而，这种基于CNN的架构仅限于输出具有四个顶点的简单多边形。PolyMapper [25]提出了一种更先进的解决方案，该解决方案基于CNN和具有卷积长短期记忆模块的RNN。在实践中，这些深度学习技术对于提取具有少量边缘的多边形（通常是来自遥感图像的独立建筑物）给出了良好的结果然而，提取更复杂的形状，每个多边形可能有数百条边仍然是一个具有挑战性的问题。基于多边形划分的方法。最后一个策略是将图像过度分割成多边形单元，然后将它们分组以近似对象silhouettes。超像素的矢量化[1]是创建多边形分区的直接方式，然而，多边形分区由空间连接未明确定义的非凸单元组成。多边形分区可以通过在输入图像上拟合几何数据结构来更鲁棒地创建。许多方法都建立在线段检测器[36]的基础上，用一组断开的线段来几何表征物体轮廓。然后，后者用于构造其边缘符合这些线段的Voronoi图[11]，具有约束边缘的凸网格[16]，或使用动力学框架的平面图[3]。这种多边形分隔物图1.我们的目标。我们的算法以一个粗略的语义概率图的图像作为输入，并输出一组低复杂度的多边形准确地捕捉感兴趣的对象，这里的狗和猫。然后通过图切割[3]或其他聚合机制[26，32]分组形成多边形。当多边形分区很好地拟合输入图像时，该策略提供准确的结果，这在实践中很少出现不幸的是，多边形划分的细化在文献中没有据我们所知，提出的唯一解决方案包括在合并三角形之前逐步细化Delaunay三角剖分的分裂阶段[18]。不幸的是，处理三角形单元不允许产生紧凑的多边形。3. 概述该算法将图像和相关联的概率图作为输入，该概率图估计每个像素属于感兴趣的不同类别的概率。该概率图通常由现有技术的语义分割方法或显著性检测算法生成。该算法从线段的动态传播产生的多边形分区出发[3]。该分区的每个单元通过语义标签来丰富，该语义标签被选择为在概率图中的内部像素上具有最高平均值的感兴趣的类别。我们的算法的目标是，然后细化这一语义多边形分区的分裂和合并细胞串联。这些细化操作由能量引导，该能量考虑输入数据的保真度和输出的复杂性。当没有分裂或合并操作可以降低能量时，算法结束。输出中的每个单元格都是与感兴趣的类相关联的多边形，如图所1.一、通过构造，输出多边形的集合保证恢复整个图像域而没有重叠，是封闭的和无交叉的，并且不包含具有相同语义标签的边缘相邻细胞。4. 算法我们用x=（m，l）表示语义多边形分区，其中m定义图像区域上的2D多边形网格，而l表示与m的面。我们用Fx（分别为Ex）表示面集（分别为非边界边缘）。8635ˆ4.1. 能量方程我们衡量的质量语义多边形划分x的能量函数U的形式：U（x）=（1−λ）U保真度（x）+λU复杂度（x）（一）第一项U保真度测量了输入数据与复杂度x的一致性，而U复杂度鼓励低复杂度输出。由模型参数λ∈[0，1]平衡的这两个项通常用网格m的边缘和小平面上的局部能量来表示。Fidelity有两个目标：（i）将每个分面的语义标签标记为与概率图一致，以及（ii）鼓励边缘与输入图像的高梯度对齐。这些目标通过参数β来平衡，在我们的实验中设置为10−3λ= 10−66个多边形157个顶点λ= 10−55个多边形94个顶点λ= 10−44个多边形62个顶点图2.在数据的保真度和输出多边形的复杂性之间进行权衡增加λ会使输出多边形更紧凑，但精度较低。感兴趣的对象：马，人，车。U保真度（x）=Σf∈Fx−wflogPmap（lf）+βΣe∈Exwe A（e）（二）保真度与多边形复杂度无关。特别地，A（e）被设计为线性函数，使得如果其中wf是面f的面积与整个图像域的面积的比率，Pmap（l f）是面f内的像素上的类lf的概率图的平均值，并且如果边缘e的两个相邻面f和f′具有不同的标号lfff=lf′，则w e是图像对角线的长度的倒数，否则为0。最后，A（e）是一个函数- 测量边缘e与图像梯度的对准：边e由两条共线边e1和e2组成，则A（e）=A（e1）+A（e2）。A（e）的线性要求每个梯度像素不应多次贡献于总能量，这解释了等式（1）中的因子ri（三）、4.2. 勘探机理这两个连续变量都表示多边形，A（e）=Σi∈NeΣ。ri1−F（mi）exp−θi22σ2（三）多边形网格和离散语义标签涉及（非凸）能量U的最小化。受用于简化三角形网格的边收缩算法的启发[4，17]，我们通过以下方式有效地探索了如此大的解空间：其中，Ne是与边缘e重叠的像素的集合，是与像素i重叠的边缘数的倒数，θi是像素i处的梯度方向与边缘e的法向量之间的角差，σ是在我们的实验中设置为π的模型- 基于局部算子的迭代机制，该局部算子分裂和合并多边形网格M的小平面。从一个初始配置开始，我们计算的能量变化分裂每个面以及合并每对相邻面的能量变化所有的能量变化（如果执行相应的8操作）按升序或-F表示经验累积在输入图像上的梯度磁的密度分布，是输入图像中随机像素的梯度幅度小于像素i处的梯度幅度mi的概率。注意，代替图像梯度，更一般的不连续性图，如[21，10]，可以通过修改方程中的密度分布F来使用。（三）、复杂度项U复杂度用边的数量惩罚复杂多边形网格（越少越好）：U复杂度（x）= |Ex|（四）如图2所示，模型参数λ是对输入数据的保真度与输出多边形的复杂度之间的权衡。请注意，我们的数据项测量数据der，即，首先是更多的负能量变化。前...探索机制则包括在优先级队列的顶部操作使能量降低最多的移动。此修改之后是优先级队列的更新算法1中给出了探索机制的伪代码。我们现在详细介绍该算法的主要组成部分。算法1探测机制一曰：初始化语义多边形分区x第二章：初始化优先级队列Q3：而Q的顶部操作i使能量U减小到4：使用合并或拆分操作i更新x5：更新Q6：结束while8636图像域Voronoi分割动力学分割图像域+模拟退火图3.初始化。顶部（RESP。底部）行示出了初始分区（分别输出多边形）。感兴趣的对象是人和自行车。从由一个矩形面（列1）组成的分区开始探索机制通常会产生缺少对象（如自行车）的结果。初始Voronoi分区[11]（第2列）过于碎片化，无法输出低复杂度多边形。我们的算法在动态分区[3]（第3列）中表现最好，在准确性和多边形复杂性之间具有良好的权衡此选项返回与模拟退火探索（第4列）类似的结果，但处理时间减少了两个数量级。为了清晰起见，在这里和下面的图中，我们没有在视觉结果中显示背景多边形（在图像边界处）初始化。因为探索机制发现局部最小值，所以需要良好的初始配置。在我们的实验中，我们使用[3]中提出的动态划分方法构建初始语义多边形划分。它以快速和可扩展的方式产生一个多边形单元的分区，该分区可以很好地捕获图像中的均匀此分区将转换为2D多边形网格。然后，我们为每个方面分配语义标签，该标签返回概率图中内部像素的最高平均值。初始化的影响如图3所示。合并运算符。合并运算符将至少有一条公共边的两个小平面合并为单个小平面。更新包括移除两个原始面之间的所有公共边缘，如图4所示。新的、合并的分面的语义标签被选择为关于概率图的最可能的标签。分裂算子。此操作符通过插入新边和顶点将一个面划分为多个面。我们首先检测原始刻面内的一组切割方向。这些方向是通过使用区域生长算法[31]将线段拟合到输入图像来为了避免检测线段超过-重叠小平面的边缘，仅考虑小平面内缩小2个像素的像素用于拟合（参见插图中红色小平面内的粉红色像素组检测到的如图4所示，然后延伸线段，直到它们与原始刻面的外边缘或它们自身碰撞。碰撞点（分别为延长的线段）对应于新的顶点（分别为边）插入到二维多边形网格中对于每个新的方面，合并分裂图4.合并和拆分操作符。合并操作符通过重新移动公共边（顶部）来合并具有不同语义标签的两个相邻方面。分割操作符将一个方面分割成多个具有不同语义标签的方面（底部）。黑色虚线表示在输入图像中检测到的切割方向（左下）。我们将最可能的语义标签与概率图相关联。如果两个新的相邻（子）方面具有相同的语义标签，则作为分割操作的一部分，它们被立即合并。优先队列。修改配置x后，必须更新优先级队列。我们首先从优先级队列中删除当前操作和所有与修改的facet相关的合并或拆分操作。然后，我们计算所有可能影响新方面的操作的能量变化，因为能量被公式化为局部项和全局复杂度项的和，所以当拆分发生时，只有父面、其新拆分面和86378图5.线性结构的矢量化我们的算法可用于矢量化楼层地图照片（顶部）或线条画（底部）。虽然很薄，但这些线性结构可以通过紧凑的多边形以良好的精度捕获（见特写）。组成这些面的边涉及优先级队列的能量更新这些更新是快速和局部的，它们不会传播到整个网格。在我们的实验中，每次分割创建的面的平均数量是2.1，更新的边的平均数量是7.2。停止标准。当在优先级队列中排序的能量变化为-5. 实验我们的算法已经在 C++ 中使用计算几何算法库（CGAL）[35]实现。所有实验都在一台具有2.4GHz主频的英特尔酷睿i7处理器的计算机上完成。参数我们有3个模型参数λ，β，σ，都是积极的，即，当没有操作可以减少分别设为10−5，10−3，π在所有实验中，能源更多请注意，该标准保证了前-探索机制，以快速收敛，没有颠簸的影响。此外，最终解不能包含两个具有相同语义类的边相邻多边形，因为合并它们必然会降低能量（较低的U保真度，这要归功于−log的凸性，以及较低的U复杂度）。加快探索的细节。勘探机制是局部性的。这一选择的动机是低运行时间和良好的初始配置的存在(An替代方案可以是使用非局部优化算法，例如模拟退火，参见图1。图8.）观察到一个复杂的初始分区往往过度分割的概率图，我们最初（前explo- ration）合并所有相邻的小平面，只包含与相同的标签分类的像素。这大大减少了处理时间而不影响结果。为了减少检测线段的时间，当新的分裂操作被认为是，我们允许合并方面继承已经检测到的线段其父方面。我们只在被移除的边缘周围的区域中检测新的线段除了节省时间，这使我们能够细化两个相邻的小平面之间的边缘，通过操作合并，然后在同一小平面上分裂。尽管数据集的多样性。（注意，我们的算法不需要任何门槛来阻止探索。基于网格搜索选择λ和β的值;设置σ以粗略地模拟梯度方向的标准偏差。灵活性和稳健性。我们的算法已经过测试，不同类型的场景和对象。只要概率图具有良好的精度，就可以用精细的细节来捕捉诸如建筑物之类的分段线性结构诸如人类和动物的有机形状由低复杂度多边形近似。除了图像中物体的轮廓外，我们的算法还可以用于矢量化楼层地图照片或线条画草图。这两种应用通常需要使用特殊的方法来检测、过滤和连接角点到地板地图[27]或笔划到参数曲线网络[15]。相比之下，我们的算法精细地重建了这些线性结构，如图5所示。由于数据项的第二部分有利于边缘与图像不连续性的对齐，我们的算法对不精确的概率图提供了良好的鲁棒性。如图6所示，即使概率图在不同对象相遇的地方是模糊的，输出多边形也可以准确地捕获对象的轮廓8638方法压缩比101520253350沃罗诺伊[11]77.775.271.668.264.157.5基皮[3]79.277.172.869.565.662.1道格拉斯-皮克[38]83.883.381.279.476.065.7多段线[12]83.983.782.581.277.569.0我们84.184.083.783.181.377.0表1.准确度（%）与HKU-IS上的压缩方法压缩比101520253350沃罗诺伊[11]87.986.483.681.377.774.3基皮[3]88.987.685.483.079.575.2道格拉斯-皮克[38]91.290.990.188.886.679.8多段线[12]91.291.190.689.988.185.8我们91.791.691.591.491.289.7表2.准确度（%）与PASCAL VOC 2012上的压缩图6.多类对象的矢量化。概率图通常是模糊的，只能粗略地指示对象的形状（参见不同类别的颜色）。我们的算法捕捉这些对象的轮廓与低复杂度的多边形具有良好的精度。特别要注意多边形是如何很好地将物体，如女士的脸和沙发（见特写）。在右下角的示例中示出了失败的情况，其中概率图的质量太差而不能捕获下面的图像来自PASCAL VOC 2012数据集。消融研究。由于语义地图在对象边界上通常是模糊的，我们-如插图中所示，这一结果，在β=0的情况下，必须与图6中在相同初始条件但β为0的情况下获得的结果进行比较。定量评价。我们在三个不同的数据集上将我们的算法与最先进的方法进行了比较。我们首先在HKU-IS数据集[24]上测试了我们的算法，该数据集旨在评估显着我们使用Li和Yu [24]的算法计算了每个图像的概率图。我们将我们的算法与两个矢量化管道进行了比较，其中相同的显着图[24]在链接和简化对象轮廓上的像素之前进行二值化，或者通过流行的Douglas-Peucker算法[38]或者通过二次抽取[12]。我们还比较了两种通过Voronoi图构造多边形划分的细胞分组算法[11]或通过线段的动力学传播[3]。然后，通过对每个单元上平均的显著图进行阈值化，从这些分区中提取多边形我们-注意分别由Voronoi和Kippi提出的这些方法准确度是使用我们的像素化输出多边形的Intersection-over-Union来测量的。我们还将压缩度量为地面真实区域边界的像素数与多边形顶点数的比率。在实践中，我们通过改变λ来产生不同复杂度的多边形，如图2所示。表1显示了HKU-IS数据集上准确度与压缩的演变虽然所有方法都利用相同的当输出多边形具有非常低数量的顶点时。图7示出了在低压缩和高压缩下的方法的视觉比较。在低压缩下，矢量化管道Douglas- Peucker和Polyline生成精确的多边形，与我们的算法类似。由于这些管道简化了多边形的几何形状，但没有数据一致性，因此对于较高的压缩比（通常为25），其细胞分组方法Voronoi和Kippi遭受不完美的多边形分区，其中细胞经常重叠几种类型的对象。相比之下，我们的算法的合并和分裂操作允许我们细化细胞的概率图和输入图像。我们还在Pascal VOC2012数据集[13]上测试了我们的算法，该数据集是为多类分割任务设计的。该数据集包含20个对象类和1个背景类。对验证集进行评价。我们将我们的算法与相同的四种方法（ Douglas-Peucker，Polyline，Voronoi和Kippi）进行了比较，具有相同的精度和压缩指标。概率图由DeepLab算法[6]通过在类通道上的最终argmax操作之前获取输出层来生成表2显示了这五种算法的精度随压缩的变化。与HKU-IS数据集上获得的定量结果类似，我们的算法优于其他方法，特别是在高压缩下具有图6显示了我们的算法在不同对象类上获得的86390,1Douglas-Peucker折线Voronoi Kippi Ours图7.两种压缩比下的目视比较：10（顶部）和33（底部）。虽然矢量化流水线Polyline和Douglas-Peucker在较小程度上在低压缩下产生准确的多边形，但它们的精度在高压缩下下降，多边形不再与轮廓很好地对齐（参见图1）。特写）。细胞分组算法Voronoi和Kippi是不太准确的，这样的自由形式的形状，细胞往往重叠几个对象类。相比之下，我们准确地捕捉大象在两个压缩比。能源0.120.09表3.在CrowdAI映射挑战数据集上的性能平均准确率（AP）和平均召回率（AR），单位为%。我们最终在CrowdAI映射挑战数据集[29]上测试了我们的算法，该数据集由160k城市景观卫星图像组成。使用U-Net变体生成概率图[8]。我们遵循着同样的实验协议比[25]从这个数据集中提取建筑物的轮廓。特别是，我们使用了相同的平均精度（AP）和平均召回率（AR）指标。我们将我们的算法与深度学习进行了比较，0.060.0300 10 102103104105迭代次数图8.在我们的探索过程中能量U的演化nism（红色曲线）和模拟退火优化（SA，蓝色曲线）。虽然这两种优化技术收敛到类似的能量，但我们的探索机制需要比模拟退火少两个数量级的迭代。cal、greedy和old，这样的算法，例如， [4，17]，在这个领域仍然非常流行和常用。方法PolyMapper [25]，Mask R-CNN [20]基于[30]和PANet [28]的实现。表3列出了这四种方法的定量结果。我们的算法获得了最好的平均准确率和平均召回率。特别是，我们的算法优于Polymapper如插图所示，我们的算法对于100K 像素的图像通常需要几秒钟，而对于10M像素的图像则需要大约2分钟。处理时间（秒）1000100101有显著的收益。这一差异的部分原因是Polymapper顶点插入的迭代机制，其效率对于复杂形状降低通过在拓扑有效的分区上细化多边形单元，我们的算法不会受到这个问题的影响。图 9 显示了CrowdAI数据集的城市场景的视觉结果。性能图8显示，我们的探索机制达到了与非局部模拟退火相似的能量，同时快了两个数量级我们的探索机制的灵感来自边缘收缩算法的网格简化。当我-请注意，我们的代码还没有优化（超出了一般的战略表示，在结束节。4.2）。特别是最耗时的操作是优先级队列的更新，特别是对新的大面的分裂操作的模拟。如果初始分区包含Nf个面和Ne个非边界边缘，则通过对Nf个可能的分裂和Ne个可能的合并的能量变化进行排序来构造优先级队列;用于此的运行时间可忽略（<0.占总时间的1%）。最后，切割方向的计算取决于SA我们方法APAP50AP75ARAR50AR75R-CNN [20]41.967.548.847.670.855.5PANet [28]50.773.962.654.474.565.2[25]第二十五话55.786.065.162.188.671.4我们65.887.673.478.794.386.10.1110像素数（×1068640图9.使用我们的算法从卫星图像中提取建筑物：芝加哥半平方公里区域的1，178座建筑物美国，提取低复杂度的多边形（8,683顶点）。虽然紧凑，多边形捕捉一些细节（见特写）。图像像素数。它非常快，并且只在优先级队列初始化时执行一次。从输入图像中获取分割方向降低了对初始分区的依赖性，并允许更大的解决方案空间探索。局限性。由于能量U（x）不是凸的，并且由于我们的探索机制是局部的，因此结果取决于初始划分的质量如图3，分割为一系列欠分割提供了鲁棒性;然而，对图像进行过分割的初始分区会导致更准确的结果。如果不能提供或保证良好的初始划分，则模拟退火在精度方面是更好的选择，但在运行时间方面不是（参见图（八）。由于U保真度中的梯度对齐项，我们的算法对语义图中的某种程度的错误或模糊性是鲁棒的，特别是在对象边界处;参见，例如，从图2中的模糊语义图中捕捉女士的脸和沙发的多边形。六、然而，大多数像素的类概率必须是正确的，形状语法解析器也是如此。请注意，依赖于外部方法（初始分区，语义映射）是一种优势：我们的性能将随着相关技术水平的提高而提高。此外，虽然参数λ平衡了数据保真度和输出复杂度，但与矢量化流水线相反，它不允许控制输出顶点的确切数量6. 结论我们提出了一种算法提取和矢量化的图像中的对象与低复杂度的多边形。我们的算法细化的几何形状的初始多边形分区，同时标记其细胞的语义类。基于局部合并和分裂的细胞，底层机制是简单的，有效的，并保证提供无相交的多边形。我们通过地面地图和线条草图展示了我们算法在各种场景上的鲁棒性和灵活性，从有机形状到人造物体。我们还在不同的数据集上展示了它优于最先进的矢量化方法。在未来的工作中，我们计划调查的输出顶点的数量的用户控制一种方式可以是设计第三个操作符，其在分区中移除和添加相关顶点我们还希望将我们的算法推广到Bezier循环的提取，即，两个连续顶点不是由直线连接而是由贝塞尔曲线连接的多边形;它将允许我们以更好的复杂度-失真折衷来捕获自由形式的形状。致谢。我们感谢Jean-Philippe Bauchet的技术讨论。这项工作得到了ANR-17-CE 23 -0003项目BIOM的部分8641引用[1] R. Achanta和S.暂停超像素和多边形使用简单的非迭代聚类。在CVPR，2017年。一、二[2] D. Acuna，H.Ling、红腹锦鸡儿A.Kar和S.菲德勒用polygon-rnn++实现分割数据集的高效在CVPR，2018年。2[3] J. - P. Bauchet和F.拉法基Kippi：图像的动态多边形分割。在CVPR，2018年。一、二、四、六[4] M. 博奇湖 Kobbelt，M. Pauly，P. Alliez，andB. 我也是。多边形网格处理。AK Peters / CRC Press，2010.三、七[5] L. Castrejon，K.昆杜河Urtasun和S.菲德勒使用一个rnn注释对象实例。在CVPR，2017年。2[6] L- C. Chen，Y.Zhu，G.帕潘德里欧F.Schroff和H.Adam.一种用于序列图像分割的带可分离卷积的编码器-解码器。在ECCV，2018。6[7] M. Cheng，N.Mitra，X.黄，P.Torr和S.-M. 胡基于全局对比度的显著区域检测。PAMI，37（3），2015. 2[8] J. Czakon ， K. Kaczmarek ， Andrzej P. ，和 P.Tarasiewicz。数据科学项目中优雅实验的最佳实践。在EuroPython，2018年。7[9] F. De Goes，D.Cohen-Steiner，P.Alliez和M.德斯布伦二维形状鲁棒重建和简化的最优传输方法计算机图形论坛，30（5），2011年。一、二[10] P.Dollar和C. L.齐特尼克用于快速边缘检测的结构化森林。InICCV，2013. 3[11] L. Duan和F.拉法基图像分割成凸多边形。CVPR，2015。一、二、四、六[12] Christopher Dyken ， Morten Dæhlen ， and ThomasSevaldrud. 同时进行曲线简化。地理系统杂志， 11（3），2009年。一、二、六[13] M.埃弗灵厄姆湖，澳-地凡古尔角，澳-地 K. I. 威廉斯，J. Winn和A.齐瑟曼。PASCAL Visual Object ClassesChallenge 2012（VOC2012）网址：//www.pascal-network.org/challenges/VOC/voc2012/workshop/index.html。6[14] J.D. Favreau ，F. Lafarge，A. Bousseau和A. 奥沃拉用delaunay点过程提取图象中的几何结构。PAMI，42（4），2020. 2[15] J. - D. Favreau，F.Lafarge和A.布索Fidelity与相似性：一种线画矢量化的全局方法。ACM Trans. on Graphics，35（4），2016. 5[16] J. Forsythe，V. Kurlin和A.菲茨吉本基于无小角度凸约束网格的分辨率无关超像素.在2016年的国际视觉计算研讨会上。一、二[17] M. Garland和P.赫克伯特使用二次误差度量的曲面简化。在SIGGRAPH，1997中。三、七[18] T. Gevers和A.W. M. 史默德斯通过引导式Delaunay图像细分将区域分割和边缘检测相载于CVPR，1997年。2[19] N. Girard和Y.塔拉巴卡端到端学习的遥感图像分类算法。在IGARSS，2018年。2[20] K.他，G.吉基奥萨里山口Dollar和R.娘娘腔。面罩R-CNN. InICCV，2017. 7[21] P. Isola，D. Zoran，D. Krishnan和E.H.阿德尔森基于逐点互信息的清晰边界检测。2014年，在ECCV。3[22] R. 克卢什齐·恩斯基，M. N. M. vanLieshout和T. 施赖贝河基于多边形马尔可夫场的图像分割。统计数学研究所年鉴，59（3），2007年。2[23] A. 莱文施泰因角Sminchisescu和S.迪金森超像素分组的最佳轮廓闭合。ECCV，2010年。2[24] G. Li和Y. Yu.用于显著对象检测的深度对比度学习。在CVPR，2016年。二、六[25] Z. Li，J. Dirk Wegner，and A.卢奇从航拍图像中提取拓扑图。在ICCV，2019年。二、七[26] Z. Li，Wu Z. M.，S. F.昌使用超像素的分割：一种二分图分割方法。CVPR，2012。2[27] C. Liu，J. Wu，P. Kohli和Y.古川栅格到矢量：重新审视平面布置图转换。InICCV，2017. 5[28] S.柳湖，加-地Qi，H. Qin，J. Shi，and J.贾用于实例分段的路径聚合网络。在CVPR，2018年。7[29] S. 莫汉蒂Crowdai数据集：地图挑战。https://www.aicrowd.com/challenges/网站。7[30] S.P.莫汉蒂Crowdai映射挑战：使用掩码r-cnn的基线。https://github.com/crowdAI/crowdai-mapping-challenge-mask-rcnn/. 7[31] S.奥索岛韦尔迪角作者：J. Lafarge和S. Giraudot。点集形状检测。在CGAL用户和参考手册中。CGAL编辑委员会，4.14版，2018年。4[32] Z. Ren和G.沙赫纳洛维奇基于casaded区域凝聚的图像分割。CVPR，2013。2[33] C. Rother，V. Kolmogorov，and A.布莱克Grabcut -使用迭代图切割的交互式前景提取ACM Trans. on Graphics，23（3），2004. 2[34] X.孙，M。Christoudias和P.呸自由形状多边形对象定位。2014年，在ECCV。2[35] CGAL项目。计算几何算法库。5[36] R. Von Gioi，J. Jakubowicz，J. M. Morel和G.兰德尔LSD：一个快速线段检测器与错误检测控制.PAMI，32（4），2010. 2[37] L.王湖，加-地Wang，H. Lu，P. Zhang，and X.阮。使用循环全卷积网络进行显著性检测。在ECCV，2016年。2[38] S. T. Wu和M. R. G.马奎兹一个非自相交的Douglas-Peucker算法2003年IEEE计算机图形与图像处理研讨会.一、二、六[39] Z. Zhang，S.作者：J. Cao，S. Dickinson，J. Siskind和S.王.结合外观和形状信息的超边缘分组方法CVPR，2012。2

下载后可阅读完整内容，剩余1页未读，立即下载