基于最大权团选择的最优语义线检测算法及其应用

175 浏览量更新于2024-01-22 1 收藏 2.76MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

16737基于最大权团选择的Dongkwon Jin，WonhuiPark Korea Universitydongkwonjin，whpark@mcl.korea.ac.krSeong-Gyun Jeong42dot.aiseonggyun. 42dot.ai金昌洙高丽大学changsukim@korea.ac.kr摘要提出了一种新的最优语义集检测算法，在这项工作中提出了tic线。我们开发了两个网络：选择网络（S-Net）和协调网络（H-Net）。首先，S-Net计算候选线的概率和偏移量。其次，我们通过选择和删除过程过滤掉不相关的行。第三，构造一个完全图，用H网计算其边权值。最后，我们确定一个最大的重量团代表一组最佳的语义线。此外，为了评估检测到的线条的整体和谐性，我们提出了一种新的度量，称为HIOU。实验结果表明，该算法能够有效地检测出语义一致的线条。我们的代码可在 https://github.com/dongkwonjin/Semantic-Line-MWCS上获得。1. 介绍语义线[16，19]被定义为一条有意义的线，分隔场景中的不同语义区域，它近似于一条端到端的直线。当一组语义线和谐地传达图像的组成时，图像中的一组语义线可以被视为最佳，如图1（e）所示。因此，在一个最佳的集合中，这些线应该彼此协调。语义线在高级图像理解中提供重要的视觉线索[7，9，12，18，20，21，36]。在摄影中，语义线（如水平线、垂直线和对称线）是构图的重要组成部分.这些线条的和谐与照片的主观质量密切相关[7，18，20]。在自动驾驶系统中[9，12，13]，道路车道和人行道的边界应该被可靠地检测以控制车辆操纵，这也可以通过语义线来描述。此外，在透视投影下，主导平行线相交于消失点[21，36]，传达深度印象。它们也是语义线[16]。然而，语义线的检测是困难的，它往往是不明显的，隐含在复杂的边界的语义区域。(a)（b）（c）（d）（e）图1：在每个场景中，近似区域边界的直线如（a）所示。其中，（b）、（c）和（d）中示出了三个线子集，它们分别对于描述场景的组成是不充分的、过度分段的和次优的。相比之下，（e）中的一组最佳语义线和谐地传达了场景的构成。已经开发了许多技术来通过利用手工制作的特征[1，4，23，28]或深度特征[15，22，31，37]来检测场景中的线段。但是，它们可能会提取冗余的短线段或焦点在人造环境中识别明显的线条结构。最近，已经进行了几次尝试来检测语义线[10，16，19，29，32]。地平线，这是一种特殊类型的语义线，已经通过基于CNN的方法进行了估计[29，32]。在[10，16，19]中，已经提出了语义线检测器。它们有两个阶段：线检测和细化。在检测阶段，提取深线特征以分类线候选者，但隐含的线可能未被检测到，或者用于提取区分性特征的计算成本可能太高。在细化阶段，通过非最大值抑制（NMS）或成对比较来去除冗余线。虽然这些技术提供了有希望的结果，但它们可能无法考虑检测到的线之间的和谐，因此可能产生次优结果，如图1（d）所示。本文提出了一种新的算法来检测一个最佳集，1673820图2：所提出的算法的概述。提出了一种基于最大权团选择（MWCS）的和谐语义线的生成方法。我们将检测公式化为在完全图中找到最大权团[3，8]。为此，我们设计了两个网络：选择网络（S-Net）和协调网络（H-Net）。给定一个图像和一组候选线，S-Net首先计算每个候选线的分类概率和回归偏移。其次，我们通过执行选择和删除过程来过滤掉不相关的行。第三，我们构造一个完全图，其中节点集包含所选的线。H-Net计算其边权重。最后，我们确定一个最大的权重团代表和谐的语义线。实验结果表明，该算法能够准确有效地检测出和谐语义线。这项工作有以下主要贡献：• 我们将语义线检测公式化为在完整图中找到最大权重团。• 我们开发了两个网络S-Net和H-Net来构造完全图。• 我们引入了一个新的度量标准，称为HioU，来评估语义线的整体和谐性，这比[10，19]中现有的度量标准更合理。• 所提出的算法产生了与最先进的DRM技术[ 16 ]竞争的语义线检测性能，同时将计算复杂性降低了1倍。2. 相关工作2.1. 线段检测线段为图像语义学提供了重要的视觉线索。在线段检测中[1，4，23，28]，许多短使用诸如图像梯度的低级特征来检测片段。然而，这种方法可能无法区分有意义的线与噪声线。为了利用更高级别的特征，已经提出了深度学习方法[15，22，31，37]。在[15]中，通过网络预测了线热图和结点。然后，通过基于热图连接结点来获得线框。在[37]中，通过连接两个连接点生成候选线，然后将其分类为显着的或不显着的。在[31]中，通过网络计算吸引场图，以处理线段检测中的局部模糊性和类别不平衡。在[22]中，使用Hough变换块训练网络，以将局部信息与全局线先验相结合。这些方法[15，27，31，37]侧重于检测人造环境中的明显线条。2.2. 语义线检测语义线位于语义区域的边界附近，代表着图像的布局和构成.几种方法[5，10，16，19，29，32]已被用于检测隐含但语义上有意义的行。在[5，29，32]中，通过CNN检测地平线，通过利用消失点或使用线参数的软标签来细化。在[19]中，Leeet al.提出了第一个语义线检测器。他们设计了一个线池层来提取每条候选线的局部特征。这些特征被送入分类和回归层，以检测语义线。然后，基于边缘检测器[30]执行NMS方案以去除冗余线。在[16]中，Jinet al.通过设计区域池化层和镜像注意模块，提取出更具鉴别力的线特征。然后，他们选择最语义线，并删除冗余线交替通过成对排序和匹配。在[10]中，Hanet al.将线要素转换为Hough参数空间以便于平行S-netHough空间K次迭代P图像N行候选(a)线概率和偏移计算选定行(b)选择和删除H-Net⋯⋯×+选定行(c)边缘权重估计(d)求最大权团语义线线对MWCS⋯⋯16739|L|处理多个候选行。然后，他们训练了一个网络来预测线概率图，该图用于通过计算连接组件的质心来确定语义线。2.3. 道路车道线检测在自动驾驶系统中，可靠地检测道路车道、人行道或(a) 线集合(b) 正对（c）负对人行横道。早期的方法[2，11，12，35]使用手工制作的低级特征来提取车道。最近，为了应对复杂的道路场景，已经尝试使用深度语义分割框架来检测道路车道[13，14，24，25]。在[24]中，Panet al.提出了一种通过卷积层之间的消息传递来学习车道空间关系的网络。在[14]中，设计了一个网络来生成不同层的注意力图，这些注意力图用于细化更深层次的输出。在[13]中，构建了区域间亲和力图，以将车道之间的结构关系从教师网络转移到学生网络。在[25]中，为了实现高处理速度，开发了一个网络，以仅在预定义的一组行上识别每个车道的位置。3. 该算法图2是所提出的算法的概述，其中包含S-Net和H-Net。首先，给定一个图像和一组候选线，S-Net计算每个候选线的线概率和回归偏移。其次，通过选择和删除过程过滤掉不相关的候选人。第三，一个完全图，其节点集由图3：在一个线集中，一对线可以是和谐的，并将视觉注意力吸引到有意义的区域，如（b）。相反，它们可能是多余的或不协调的，如（c）。候选线生成：候选线是图像中的端到端直线，可以通过Hough空间中的极坐标进行参数化[10，17，22]。设l=（ρ，θ）表示一条直线，其中ρ是它到图像中心的距离，θ是它到x轴的角度然后，我们生成N条候选线，表示为ln=（ρn，ρn），1≤n≤N，通过对ρ和ρ进行均匀量子化。S-Net：对于每个候选线，我们计算其分类概率和回归偏移。为此，我们开发了基于传统线路检测器的S-Net [10，16，19]。图4（a）显示了S- Net的体系结构S-Net 从图像中提取卷积特征映射X=[X1，X2，...，XC]∈RH×W×C，其中H、W和C表示特征高度、特征宽度，以及频道的数量。然后，线特征图 Y=[Y1 ，Y2，...，YC]∈RN×C是通过沿l n对像素的特征进行平均而得到的;构造了所选直线的边权值由H-Net计算。最后，一个最大权重集团，Yc（n）=1np∈ln Xc（p）（1）代表和谐的语义线。3.1. 问题公式化图像中的语义线如果能和谐地传达图像的构图，就可以被认为是最佳的。换句话说，在一个最优集合中，每对语义线都应该相互协调。如图3（b）所示，一对语义线应该将视觉注意力引导到有意义的区域。相反，在图3（c）中，两条线是冗余的或不协调的。基于这一观察，我们将语义线检测公式化为在完整图中找到最大权重团[3，8]。在完全图中，检测到的线形成节点集，并且每个边权重表示相关联的两条线的和谐程度。因此，通过找到一个最大权重团，我们找到了一组最佳的和谐语义线。3.2. 节点选择：过滤候选行为所有候选线构造一个完整的图在计算上是不可行的。因此，我们只通过过滤候选行来选择可靠的节点。对于1≤n≤N和1≤c≤C，其中|Ln|表示沿L n的像素数。然后，我们通过下式获得概率向量P和行偏移矩阵O：P=σ（f1（Y））和 O=f2（Y）（2）其中f1和f2分别是用于分类和回归的大小为C×1和C×2的全连通层，σ（·）是S形作用函数。 F或第n行候选项ln=（ρn，Δn），Pn表示它是语义的概率，On= Δln=（Δρn，ΔΔn）是3.4节中行细化的偏移向量。在补充文件中详细描述了S-Net的体系结构和训练过程。选择和移除：在传统算法[10，16，19]中，为了检测语义行，仅选择概率高于阈值的行，然后进行后处理（例如，非最大抑制）。然而，这可能导致假阴性，假阴性由于是隐式的而具有低概率，但是仍然是语义性的。为了减少这种假阴性，16740=(a) S-net(b) H-NetCLSPRegOREG1吉吉Reg2Reg2IRC功能。H-Net：我们使用IRC模块开发H-Net。它需要一个图像和一对线，索引为i和j，以产生范围从0到1的和谐分数hij图4（b）显示了H-Net架构。VGG 16 [26]的卷积层用作特征提取器，其后是IRC模块的三个并行分支和行池层。我们采用线池化层来分别对线i和j执行（1）中的池化。我们使用两种类型的回归层：一种用于生成两条线的IRC得分（Reg1），另一种用于计算每条线的一元可靠性（Reg2）。最后，我们通过将IRC分数乘以一元可靠性水平的平均值来计算和谐分数hij图4：S-Net和H-Net的架构：（a）S-Net采用图像和线候选，并提取线特征图。然后，通过两个完全连接的层计算候选线的分类概率和回归偏移。(b)H-Net采用图像和线对（i，j）来提取局部和区域间特征。使用两种类型的回归层来计算和声得分hij。在阈值处理中，我们执行图2（b）中的选择和去除过程。我们选择最可靠的线路l我们如下配置H-Net的训练数据。假设图像中的每对地面真值语义线都是相互协调的。因此，我们声明这些对为正，而其他为负。换句话说，线对（i，j）仅当两条线i和J是语义的。然后，注释harmon yscoreh<$ij为1或0，取决于对（i，j）是否为正。然而，这种对正对的严格定义导致了类的不平衡：正对太少了。因此，我们干扰每个正对的线位置并注释相应的harmon y scoreh'ij与2 2ii= argmaxiPi（三）e−（di+dj），其中di和dj表示线路干扰i和j。定义了训练H-网的损失函数然后移除与所选线重叠的线。具体来说，我们在以lim为中心的5×5网格内删除24条在Hough空间[10，22]。我们执行此过程K次，以组成K个选定线的节点集。图5（b）和图5（e）示出了图5（b）和图5（e）上的这种选择的线。图像和Hough空间。3.3. 边缘加权：和谐分数估计区域间相关性：区分阳性对在图3（b）从图3（c）中的负对，我们设计了区域间相关（IRC）模块，该模块分析由一对线分隔的区域。设Ri，1≤i≤M，表示由两条直线分隔的区域可以有三个或四个区域，即M= 3或4。我们通过以下方式提取Ri的区域特征向量ri：公式为：H=（hij−h<$ij）2，其中h<$ij是地面实况谐波分数，hij是其估计值。补充文件更详细地描述了H-Net的训练过程和架构。3.4. 图形优化：找到和谐的线条图的构造：我们构造一个完全图G =（V，E），其中节点集V={v1，v2，.，vK}表示使用第3.2节中的S-Net选择的K条线。Ev-每对线由边集合E={（vi，vj）：i/=j}中的边连接。在第3.3节中，每个边都被H-Net分配了权重w（vi，vj）=hij。图5（f）可视化了一个完整的加权图。MWCS：如前所述，如果一组语义线中的任何两条线彼此和谐，则该组语义线是最佳的1Σ我|R i|p∈Ri X（p）.（四）其他.因此，找到这样一个最优集合等价于找到一个节点的团[8]，这些节点相互连接并且具有最大的权重和（即，和谐得分）。我们计算该区域的softmax概率ai|Ri|到缩放区域特征向量，然后将缩放矢量为设θ表示一个团，由成员节点。然后，我们定义协调能量团θ的E谐函数（θ）为R=[ar，ar，ar，ar]（5）E1 12 23 34 4harmony（θ）=i∈θj∈θ，j>iw（vi，vj）（6）尺寸为C×4。如果M=3，我们在最右边的向量中填充零。然后，将R馈送到全连接层中以产生它是θ中所有边权重的和。找到最大化这个能量的团是NP困难的[6]。然而在这个CCHN图像线候选W特征图线特征图CH图像线对（i，j）W特征图线路合并线路合并区域间相关性×+R16741不F-测量=。（十二）(a)（b）（c）（d）（e）（f）（g）图5：所提出的算法的说明：（a）输入图像，（b）通过选择和删除过程选择的线，(c) 语义线，（d）霍夫空间中的候选线的概率，（e）对应于所选线的节点集，（f）完全图，（g）最大团。在（f）中，根据其权重是否高于（8）中的阈值κ，边缘被描绘为绿色或红色。当权重接近零时，透明度增加。工作时，K被设置为一个小数字。默认K为8。有大约2K个可能的集团，这也是可管理的。因此，采用穷举搜索来找到最大权重团。首先，我们生成可能的图G中的团Θ={θt}，其中每个团θt由两个以上的节点组成。然后，我们选择使协调能量最大化的最大权重团：θt=argmaxθ∈ΘEharmony（θt）（7）受约束mini，j∈θw（vi，vj）>κ（8）其中κ是阈值。如果不存在满足约束的团，则我们选择最大单节点团θ={i}由i= arg max hii.（九）我通过将相同的线作为重复输入应用于H-Net来获得自和谐分数hii在获得一组和谐的语义线之后，我们通过以下方式对每行进行细化：CULANE [24]：它是一个用于道路车道检测的数据集，包含88，000张训练图像。它的34，680张测试图像分为9类。对于每个图像，提供了最多4条道路车道的像素级掩模。在“无车道”类别中的3，911幅测试图像上对所提出的算法进行了测试4.2. 度量常规指标：有两个现有的指标来评估语义线检测结果：mIoU [19]和EA-评分[10]。在mIoU度量中，如果检测到的线与地面真实语义线的mIoU分数大于阈值τ，则检测到的线被认为是正确的，如图6（a）所示。在EA分数中，如果检测到的线与地面实况的相似性大于阈值，则检测到的线被认为是正确的，如图6（b）所示。相似度由两个因子Sd和Sθ组成，它们分别基于直线中点间的欧氏距离和直线间的角距离。在这两个指标中，精确度和召回率都是通过以下方式计算的：lv + Δlv（十）精度=Nl、召回=Nl（十一）i iNl+ NeNl+ Nm其中Δlvi 表示由S-Net 的回归层生成的fset向量。图5（c）和（g）显示了图像和霍夫空间上的一组和谐语义线。4. 实验结果4.1. 数据集SEL [19]：它是第一个语义线数据集，包含1，750张户外图像，分为1，575张训练图像和175张测试图像。每条语义线由图像边界上的两个端点的坐标来标注。SEL Hard [16]：这是一个更具挑战性的数据集，用于测试语义线检测器。它包含从ADE 20K分割数据集[ 34 ]中选择的300张测试图像。它的语义线不那么明显，在更混乱的场景中更严重地被遮挡。SL5K [33]：就线条和场景类别的数量而言，它是一个丰富多样的数据集。它由4,000张训练图像和1,000张测试图像组成。其中Nl是正确检测到的语义线的数量，Ne是假阳性的数量，并且Nm是假阴性的数量。然后，通过以下方式计算F度量：2×精度×召回精度+召回在阈值τ的整个范围内测量精确度、召回率、F-测量曲线的曲线下面积（AUC）性能，分别用AUC P、AUC R和AUC F表示[19]。然而，这些度量仅测量每个检测到的线的位置精度。它们不考虑多个检测到的线在场景中彼此之间的和谐程度。因此，它们可能会产生误导性的分数，如图7所示。HioU度量：我们提出了基于和谐的交叉-联合（HioU）度量来评估检测到的线的整体和谐性。检测到的线倾向于传达关于图像的组成的和谐印象，当它们16742Y检测结果地面实况R RYIoUR，R Y+IoU ， YEA=（Sl，l Sl，l）2IoU（s1，t1）+IoU（s2，t1）++IoU（t3，s5）mIoU=212D12HIoU=9(a) mIoU度量(b) EA评分(c) HioU度量图6：mIoU [19]和EA评分[10]的两个现有指标以及拟议的HIoU指标的图示表1：SEL和SEL硬数据集上AUC和HIoU评分（%）的比较。还比较了以每秒帧（fps）为单位的处理速度。对于AUC评分，使用mIoU度量。SEL SEL Hardfps AUC P AUC R AUC F HIoU AUC P AUC R AUC FHIoUSLNet [19] 80.7284.50 82.57 77.87 74.22 70.68 72.41 59.71 7.352019年12月29日星期四上午10：00-11：00版权所有© 2018 - 2019www.bjjcn.com- 保留所有权利拟议数89.6184.2186.83 81.03 87.6072.56 79.38 65.99 21.74地面实况检测结果Ⅰ检测结果ⅡMiou0.90≈0.88EA评分0.79≈0.81HIoU0.68>0.59图7：mIoU [19]，EA评分[10]和拟议的HIoU指标的比较：对于相同的地面实况有两个检测结果。在结果I中，每个检测到的线的位置与地面实况不同，但是检测到的线相对较好地传达了图像的组成。在结果II中，两条检测到的线与地面实况完全匹配，但它们与剩余的一条不协调。作为一个群体，它们不如结果I。由于mIoU和EA评分仅考虑每条线的准确性，因此它们无法区分这两个结果之间的差异相反，HioU正确地量化了结果I的优越性。图像的划分与地面实况的划分一致。假设检测到的线的集合和地面实况线的集合将图像划分为区域S={s1，s2，...，sN}和T ={t1，t2，.，tM}。然后，我们将HioU定义为ΣNΣMHIoU=i=1maxkIoU（si，tk）+j=1maxkIoU（tj，sk）.（十三）N+M换句话说，对于每个si，我们找到匹配的tk并测量它们的IoU。类似地，对于每个tj，我们用匹配的sk找到它的IoU。然后，这些双向匹配的IoU的平均值成为HIoU分数。图6（c）示出了如何计算HIoU分数。图7显示，HioU更合理地评估检测到的线路图8：根据SEL数据集上的阈值τ比较精确度、召回率和F-测量曲线。使用mIoU度量。通过考虑检测到的线之间的和谐，比现有的度量做。4.3. 比较评估我们将所提出算法的语义线检测结果与传统SLNet[19]、DHT [10]和DRM [16]的结果进行了比较。SEL上的比较：图8比较了SEL数据集上所提出的算法和传统算法的精度、重新调用和F测量曲线。表1报告了这些曲线的AUC性能。与传统算法相比，该算法的查全率较差，但查准率较高. F-measure是查全率和查准率的调和平均值。值得注意的是，所提出的算法优于所有传统的算法在F-测量和HIoU。SEL Hard的比较：表1还比较了SEL Hard的结果。对于这种比较，我们也使用了使用SEL数据集中的训练图像训练的相同算法。如前所述，SEL硬图像比SEL图像复杂得多此外，许多SEL图像仅包含一条语义线。因此，在本发明中，S1S2t1S3S5S4S6t2t3L1SDL2S16743图9：语义线检测结果的比较。左边的三张图片来自SEL，其他的来自SEL Hard。表2：SL5K数据集上EA评分（精确度、召回率、F测量）的比较。精度召回F测量HioUZhao等人 [33个]70.374.572.3-提出79.481.480.374.1仅使用SEL图像来学习更复杂的SEL硬图像中的线之间的和谐是具有挑战性的。然而，该算法产生的竞争结果DRM，其中执行最好的，但需要太高的计算成本。请注意，建议的al-出租m比DRM快约20倍。此外，该算法优于DRM的AUC P。图9比较了SEL和SEL Hard数据集上的检测结果。传统的语义线检测算法往往检测到对象边界附近的冗余线或不能检测到隐含的语义线.相比之下，该算法检测隐含以及明显的语义线更可靠，同时确保检测线之间的和谐。SL5K上的比较：表2比较了SL5K数据集上的性能。Zhao等人。 [33]仅在EA评分度量中报告了他们算法的性能，并且他们的训练代码或模型参数不可用。因此，我们仅比较EA评分度量的结果，如[33]所做。我们看到，该算法在精确度、召回率和F-测量方面分别以9.1、6.9和8.0的幅度超过了Zhao等人。此外，所提出的算法产生74.1的HIoU分数。图10显示了一些检测结果。图10：SL5K数据集上所提出算法的检测结果。CULANE上的比较：我们在CULANE中的“无车道”类别上将所提出的算法与传统的道路车道检测器[14，25]进行了比较，其中车道是隐式或不可见的。传统的技术是基于分割框架和地面实况也给出了一个二进制掩码为每个车道。因此，为了进行比较，我们将与每个车道的分割掩码最重叠的线声明为语义线。补充文件中详细描述了实验设置。图11显示了一些地面实况语义线，并比较了它们的检测结果。虽然这些线条非常不明显，但所提出的算法比传统的检测器更可靠地检测到它们。表3比较了AUC和HIoU评分。注意，与传统的检测器不同，所提出的算法不使用场景中的最大车道数的信息。传统的算法对隐含或不可见车道的召回率很低.所提出的算法是稍微少预-SLNet [19][第10话]DRM [16]提出地面实况16744图11：CULane数据集上语义线检测结果的比较表3：CULANE数据集中“无泳道”类别的AUC和HIoU评分（%）比较AUC P AUC R AUC FHioU UFS[25]93.00 83.47 87.9872.68沙特里亚尔[14]93.6484.20 88.67 74.77拟议数表4：SEL数据集上S-Net、H-Net和MWCS过程的消融研究。AUC F HioUI.S-Net 77.75 69.03II.S-Net+H-Net+MWCS（不含IRC）84.66 79.14III. S-Net+H-Net+MWCS（无偏移）IV. S-Net+H-Net+MWCScise，但比传统检测器提供了更高的召回率和F-测量分数。此外，所提出的算法产生了更好的HIOU分数比传统的检测器，通过利用道路车道的和谐属性，如相邻车道之间的平行度和相等的宽度。运行时间分析：表1还比较了运行时间。我们使用的PC与英特尔酷睿 i5-8500 CPU 和 NVIDIA RTX 2080 tiGPU。请注意，SLNet和DRM需要大量时间来提取有区别的线特征。特别是，DRM是1.05 fps时最慢的方法，因为其镜像注意模块和迭代排名和匹配过程要求太高。所提出的算法和DHT的速度要快得多。虽然DHT最快，但其重呼性能并不具有竞争力。4.4. 消融研究我们进行消融研究，以分析SEL数据集。表4比较了几种消融方法。方法I仅使用S-Net来检测语义线，其中迭代地执行选择和移除过程，直到最大概率变得低于0.5。方法II也使用了H-Net和MWCS过程，但H-Net的训练没有使用IRC模块。在方法III中，线偏移不用于细化检测结果。方法I明显劣于其他方法，表明H-Net和MWCS对于检测和谐语义线都是必不可少的。此外，通过比较II和IV，我们看到区域间相关性特征对于估计两条线之间的和谐是有效的。此外，从III到IV，请注意，通过使用回归偏移细化检测到的线，性能得到了改善。5. 结论我们提出了一种新的语义线检测器。首先，我们对S-Net进行去重以计算候选线的线概率和偏移量。其次，我们通过选择和删除过程过滤掉不相关的行。第三，构造了一个完全图，用H-Net计算了图的边权值。最后，我们确定了一个最大的权重团代表一组和谐的语义线。此外，为了评估检测到的线的整体和谐，我们提出了一种新的度量称为HioU。实验结果表明，该算法能够有效地检测出语义一致的句子。确认这项工作部分由韩国国家研究基金会（NRF）通过韩国政府（MSIT）在NRF-2018 R1 A2 B3003896资助下支持，部分由42 dot Inc.UFS [25]SAD [14]拟议的地面实况16745引用[1] 库尼特·阿金拉尔和吉汉·托帕尔EDLines：一个带有错误检测控制的实时线段检测器模式识别Lett. ， 32（13）：1633[2] 穆罕默德·阿里城市道路中车道标志的实时检测IEEE智能车辆研讨会，第7IEEE，2008年。[3] Gary Chartrand和Ping Zhang。色图论CRC Press，2019.[4] 这是德索纽，莱昂内尔·莫桑，还有让·米歇尔·莫雷尔。有意义的结盟。国际计算机目视，40（1）：7-23，2000.[5] 劳尔·迪亚兹和阿米特·马奎尔。有序回归的软标签InProc. IEEE CVPR，2019.[6] 科琳·费尔曼，马丁·拉布·贝，吉尔伯特·拉波特。广义网络设计问题。欧洲运筹学杂志，148（1）：1[7] 迈克尔·弗里曼摄影师出版社：Focal Press，2007.[8] Jonathan Gross 和 Jay Yellen 。图论及其应用。 CRCPress，2007.[9] Chunzhao Guo，Takayuki Yamabe，and Seiichi Mita.基于语义图的智能车辆碰撞场景下鲁棒道路边界估计在智能车辆研讨会上。IEEE，2012年。[10] 祁寒，赵凯，徐君，程明明。深度Hough变换用于语义线检测。在proc ECCV，2020年。[11] Yinghua He，Hong Wang，and Bo Zhang.城市交通场景中基于颜色的 IEEE Transactions on IntelligentTransportation Systems，5（4）：309[12] Aharon Bar Hillel ， Ronen Lerner ， Dan Levi 和 GuyRaz。道路和车道检测的最新进展：综述。马赫目视Appl. ，25（3）：727[13] Yuenan Hou ， Zheng Ma ， Chunxiao Liu ， Tak-WaiHui，and Chen Change Loy.用于道路标记分割的区域间相似度提取。在Proc. IEEE CVPR，2020。[14] Yuenan Hou ， Zheng Ma ， Chunxiao Liu ， and ChenChange Loy. 通过自注意蒸馏学习轻量级车道检测CNN。InProc. IEEE ICCV，2019.[15] 黄昆，王一凡，周梓涵，丁天骄，高盛华，马毅。学习解析人造环境图像中的在proc IEEE CVPR，2018年。[16] Dongkwon Jin，Jun-Tae Lee，and Chang-Su Kim.使用镜像注意和比较排序与匹配的语义线检测在Proc.ECCV，2020中。[17] Nahum Kiryati，Yuval Eldar，and Alfred M Bruckstein.概率Hough变换模式识别，24（4）：303[18] 伯特·克拉格斯。摄影：构图的艺术。西蒙和舒斯特，2012年。[19] Jun-Tae Lee ，Han-Ul Kim ，Chul Lee，and Chang-SuKim.语义线检测及其应用。InProc. IEEE ICCV，2017.[20] Jun-Tae Lee ，Han-Ul Kim ，Chul Lee ，and Chang-SuKim.户外场景的摄影构图分类和主要几何元素检测 J.目视Commun.图像代表。，55：91[21] Seokju Lee ， Junsik Kim ， Jae Shin Yoon ， SeunghakShin ， Oleksandr Bailo ， Namil Kim ， Tae-Hee Lee ，Hyun Seok Hong，Seung-Hoon Han，and In So Kweon.VPGNet：用于车道和道路标记检测和识别的消失点引导网络。InProc. IEEE ICCV，2017.[22] Yancong Lin，Silvia L Pintea，and Jan C van Gemert. 深Hough变换线先验。在Proc. ECCV，2020中。[23] Jiri Matas，Charles Galambos，and Josef Kittler.使用渐进概率Hough变换的线的鲁棒Comput. 目视图像理解，78（1）：119[24] Pan Xingang ， Jianping Shi ， Ping Luo ， XiaogangWang，and Xiaoou Tang.Spatial As Deep：用于交通场景理解的Spatial CNN在Proc. AAAI，2018年。[25] 秦泽群，王环宇，李Xi。超快速的结构感知深度车道检测。在Proc. ECCV，2020中。[26] 凯伦·西蒙尼扬和安德鲁·齐瑟曼用于大规模图像识别的深度卷积网络InProc. ICLR，2015.[27] 易孙、许慎韩、孙凯。Sem-LSD：一个基于学习的语义线段检测器。 arXiv 预印本 arXiv ： 1909.06591 ，2019。[28] 拉斐尔·格隆彭·冯·吉奥伊，杰瑞米·雅库博维奇，让·米歇尔·莫雷尔，格雷戈里·兰德尔. LSD：一种具有错误检测控制的快速线分段检测器。IEEE传输模式分析马赫内特尔，32（4）：722[29] Scott Workman，Menghua Zhai和Nathan Jacobs。野外的地平线。InProc. BMVC，2016.[30] 谢赛宁，涂卓文。整体嵌套边缘检测。InProc. IEEEICCV，2015.[31] 薛南，白松，王福东，夏桂松，吴天福，张良培。学习吸引场表示，用于鲁棒的线段检测。InProc. IEEECVPR，2019.[32] Menghua Zhai，Scott Workman，and Nathan Jacobs.在非曼哈顿世界中使用全局图像上下文检测消失点。InProc. IEEE CVPR，2016.[33] 赵凯、韩琦、张长斌、徐军、程明明。深度Hough变换用于语义线检测。arXiv预印本arXiv：2003.04676，2020。[34] Bolei Zhou，Hang Zhao，Xavier Puig，Sanja Fidler，Aesthetic Barriuso ， and Antonio Torralba. 通过 ADE2020K 数据集进行场景解析。InProc. IEEE CVPR，2017.[35] Shengyan Zhou，Yanhua Jiang，Junqiang Xi，JianweiGong，Guangming Xiong，and Huiyan Chen.提出了一种基于几何模型和gabor滤波器的车道线检测方法。IEEE智能车辆研讨会，第59IEEE，2010年。[36] Yichao Zhou，Haozhi Qi，Jingwei Huang，and Yi Ma.NeurVPS ：通过圆锥卷积进行神经消失点扫描。在Proc. NIPS，2019年。[37] 周一超，齐浩志，马毅端到端线框解析。InProc. IEEEICCV，2019.

下载后可阅读完整内容，剩余1页未读，立即下载