BIND：用于无纹理目标识别的二进制集成网络描述器

25 浏览量更新于2023-10-17 收藏 2.62MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

2068BIND：用于无纹理目标识别的陈耀宗1、李志成2及钱克茂11南洋理工大学计算机工程学院（SCE），新加坡南洋大道N4座，639798网址：jchan015@ntu.edu.sg，MKMQian@ntu.edu.sg2新加坡科学技术研究院（A*STAR），信息技术研究所（I2R），1 Fusionopolis Way，Connexis（South Tower），Singapore138632jalee@i2r.a-star.edu.sg摘要本文提出了BIND（二进制集成网络描述器），一种无纹理的对象检测器，编码多层二进制表示的网络，用于高精度的基于边缘的描述。我们提出的概念对齐层的对象大小的补丁（网）到高度分散的抗遮挡线段中点（linearity）编码区域信息到有效的二进制字符串。这些轻量级网络通过其高空间分辨率鼓励有区别的对象描述，从而能够对对象的边缘和内部纹理较少的信息进行高度精确的编码。BIND通过其独特的二进制逻辑运算编码和匹配技术实现了旋转、尺度和边缘极性等除了产生高效的计算性能外，BIND还获得了显着的识别率，超过了最近最先进的无纹理对象检测器，如BORDER，BOLD和LINE2D。1. 介绍无纹理物体在现实世界中是一个熟悉的景象，然而，广泛建立的识别算法，如SIFT（尺度不变特征变换）[1]和SURF（加速鲁棒特征）[2]在这种情况下基本上是无效的。这是由于它们严重依赖于高度纹理化、特征丰富的信息丰富的局部区域，而这些区域在同质发生中相对稀缺。因此，这个具有挑战性的问题导致了各种最近的工作，如[3-5]，其中利用对象大小的区域信息来收集有区别的内容。尽管产生了不错的结果，但大量使用这种相当大的空间架构通常会导致昂贵的计算运行时间和内存负载。由于诸如实时检测系统和移动应用之类的现代技术具有有限的计算资源，因此越来越多的共识是：图1：BIND在高杂波和半遮挡情况下的无纹理物体识别。(Top)关键点匹配，（底部）二进制网匹配，其中绿色框表示角块匹配，黄色框表示内部同质块匹配，灰色框表示背景/无匹配块。今天一种行之有效的方法来产生快速和内存效率的检测器，而无需硬件加速是通过二进制描述符。像BRIEF（Binary Robust Independent Elementary Features）[6]和ORB（Orient FAST and Rotated BRIEF）[7]这样的作品利用局部补丁进行像素之间的简单二进制强度测试，以形成它们的描述符。这导致了非常有效的向量大小和匹配速度，因为这些字符串可以使用汉明距离快速比较。然而，这些二进制描述符与上述算法有着相同的困境，因为它们同样需要丰富的本地信息来进行强度测试。因此，在追求无纹理检测器，以迎合现代技术的需要，我们提出了BIND（二进制集成网络描述符），检测器2069它使用独特设计的多层二进制网络在均匀条件下描述了大对象大小的区域。BIND采用关键点描述符结构，首先使用Lincoln[3]形成兴趣点，Lincoln [3]是最近推出的一种高度抗遮挡的线段检测器，然后覆盖我们专有的二进制网络层，根据每个linelet中点定向，用于编码对象的各种区域特征。网络本质上是一个包含大量物体的正方形块，这些块被平均划分为高分辨率的位表示块。在关键点对齐时，它们变换成n个网络层以表示n位数据，其中每个内部块嵌入诸如旋转不变角度基元的信息，以及对象边缘和内部均匀空间的结构定位。BIND还解决了背景对比度的问题，由于场景中的不同背景，线梯度方向的极性不同，这会影响基于线/方向边缘的描述符，如[3，4，8]。最后，匹配是通过一系列的二进制算术指令，同时结合各种技术，包括增强性能，如规模不变性和遮挡阻力。总之，BIND图1展示了BIND本文的其余部分如下。第2评论相关的texture less为基础的作品。第3节和第4节分别描述了BIND的元素及其编码方案。第5节总结了整个对象识别流程。第6节展示了比较实验结果。最后，第7节结束了本文。2. 相关工作尽管已经提出了无数的对象检测器因此，本节回顾了对无纹理类型有重大贡献的各种技术。基于模板的检测器有能力检测无纹理物体的一种开创性方法是倒角匹配[9，10]。它本质上是一个基于边缘的模板匹配器，模型和场景通过基于距离变换的相异性度量进行比较然而，它受到诸如噪声敏感性和其他遮挡因素等问题的困扰。这提出了几个倒角相关的增强，例如基于形状的[11]，基于梯度方向的[12，13]和基于Hausdorff距离的 [14 ， 15] 方法，结果各不相同。最近，Hinterstoisser等人提出的基于梯度的模板方法。”[16]这是一个成功的例子。他们的技术创造了LINE-2D，通过将梯度方向量化为固定方向来生成模板，同时采用几种优化方案来快速窗口化输入图像之间的相似性度量。这种方法获得了适度的普及产生了各种补充工作，如[5，17，18]，其中分别添加了表面法线（LINE-MOD），颜色信息和遮挡推理等功能以帮助其发展。除了上述技术之外，诸如颜色/形状模型[19]和基于3D-CAD[20]的模板方法等着名作品也报告了不错的检测结果。尽管如此，基于模板的算法中存在的一个主要缺陷是可扩展性，其中通常需要大量的训练数据来补偿视觉属性的缺乏，例如旋转，视点和尺度变化。基于形状的检测器另一种技术由Ferrari等人提出。[21，22]，分组局部关联边链称为k相邻段（kAS），通过合并其距离，方向和长度来学习对象的形状模型。然后，该学习模型通过初始Hough投票定位检测场景对象，然后在投票区域内进行形状匹配算法。这种方法，或一般的形状检测器，往往是非常敏感的闭塞和轻微的失真中断或丢失的边缘。其他相关的基于形状的工作包括[23-在所有的方法中，基于关键点的技术似乎优于其他由于它的能力，将多个不变的属性。在识别性能方面，BORDER（封闭区域的边界定向矩形描述符）[3]是达到最先进水平的最新算法。它获得了令人印象深刻的检测结果，在严重混乱的遮挡场景中，通过高度可重复的抗遮挡线段称为Lincoln，它与一个区域包围有向矩形旋转方案的描述耦合。然而，矩形旋转可能在计算上相对昂贵，特别是在需要处理大量关键点的杂乱场景中。此外，其相当低的块分辨率[4×4]可能会影响高细节对象实例中的描述符精度。前面的BORDER是一个线描述符，称为BOLD（Bunch of LineDescriptor）[4]，其中每个线段[27]中点聚集相邻的线段进行区域描述。聚集的线形成角度基元对以填充二维描述符。虽然产生了不错的结果，但在其文献中报告的一个警告是，在线聚合期间对附近杂波的敏感性。此外，如[3]中所报道的，由于在遮挡情况下的中点偏差，原始形式的线段表现不佳。这一类别中的另一个重要工作包括[8]的边波星座技术，其中使用角度跟踪路径反射方法来累积短的分段边缘。然而，该方法对微小的遮挡/照明/噪声非常敏感，因为这些会导致角度轨迹的改变。与基于关键点的检测器相关的其他算法包括基于线的工作，例如[282070(a)（b）第（1）款（c）第（1）款MSB*n。1*2个*1*+LSB图2：在遮挡设置中用于无纹理对象的最大碎片小线检测。(a)原始模型（顶部）和场景（底部）图像。(b)最大碎片化的线检测。(c)通过手动将模型图像放置到场景图像上来匹配高度可重复、精确和抗遮挡的最大细线中点对应。3. BIND元素BIND开始其识别计划，通过采用一个遮挡抵抗线段检测器，称为Lincoln。然后，这些片段具体化为关键点，并与我们专有的分层二进制网络合并，用于描述大型对象大小的区域。因此，本节首先详细介绍BIND3.1. 最大线碎片基于线的表示已被证明是用于无纹理类型中的兴趣点配准的有效方法[3，4，8，28-在这些基于线的技术中，Lincoln[3]是线段[27，31]的扩展，已被证明是最稳定的，特别是在遮挡情况下。它使用模型-场景比例概念，通过根据场景中的杂乱程度调制它们的宽度来分割过度伸长的线段，ωmax= min[max（ω，Rmin），Lmax]，（1）其中，ω是增长超过2 ω的线段的碎片宽度，而ω表示从模型-场景图像之间检测到的线段比率导出的宽度阈值[3]。 Rmin是一个容易获得的参数，在LSD[31，32]中假设该参数可以自动确定将任何给定的紧密取向的像素簇具体化为线段所需的最小区域大小。最后，Lmax表示模型对象的最长线段，当模型-场景比例较低时，该线段将线性恢复为线段，即ω >Rmin且ω≥Lmax。总而言之，Lincoln对由于遮挡引起的线段中点偏移免疫，同时为描述提供高度可重复的基础由于BIND强调高精度的区域描述概念，因此我们建议以最大频率对线性进行分段，以适应我们描述符的分辨率。这(a)（b）第（1）款图3：（a）（16×16）二进制网络及其线对齐的示例。(b)BIND只要检测到的线段 ≥2ω ，就可以简单地通过应用ω=Rmin来实现。虽然这增加了计算负荷，由于冗余的碎片，我们的实验（图。8e）表明，即使关键点数量增加，BIND仍然能够实现与其他基于关键点的描述符相比具有竞争力的识别速度。图2展示了在遮挡和杂乱场景中无纹理对象的最大碎片线性度3.2. Binary Net为了最大限度地提高独特性，现代无纹理检测器已习惯于将其描述符方案区域化到对象大小的空间中[3，4，8，16]。然而，BIND更进了一步，不仅用大对象大小的正方形框封装区域，而且通过大量分割框的内部以形成其二进制块来鼓励精确的对象描述。对于每个细线关键点，我们通过将其中心对齐到细线中点并旋转来“投射”此网络它指向linelet的指向。由网络“捕获”的区域信息随后由每个内部块描述。此外，由于二进制表示只允许两种可能的状态，我们堆叠n个额外的网络层，以形成多达2n个状态，用于编码多样性。图3演示了区域封装的二进制网络对齐和BIND块大小网络内的平方划分为单个比特空间顺序地组合成一个长二进制字符串它对封装的均匀空间、边缘信息以及它们的时间位置进行编码。为了在网络的编码精度和总容量之间获得理想的平衡这是通过将块的宽度指定为w block = R Smin来实现的净尺寸BIND不是标准尺寸的净，而是指定其净尺寸以自动符合输入模型对象，从而实现最佳区域连续性。这是通过首先应用最小封闭mnmbl$c&. ..2071净W净框算法[33]到模板提供的对象掩模，或自动阈值显著掩模[34]（图4a-4c），随后将初始网的宽度定义2lobj，其中lobj是当前对象包围框的较长边。总之，这种设计确保了足够的覆盖范围即使当网位于物体的远角时也是如此接下来，由于二进制网络将被表示为位串，因此总块满足字节格式（8的倍数）以适应计算机存储和算术技术是至关重要的因此，每行/列的总块和最终的净宽度被建立为，(a)(b)（c）第（1）款(d)（e）（f）n块= 8 ·ceil.′净8 ·W块Σ、（二）图4：最小包围盒和均匀掩模创建过程。(a)模特形象。(b)模型的显着图。(c)显著图的自动阈值化，wnet=n块·w块，（3）其中，W′和W块之间的除法被向上舍入到8的最接近倍数，以找到每行/列N个块的总块，并且W_net是从N个块和W块导出的最终净宽度。简而言之，每个二进制网络层请注意，尽管块宽度是固定的，但网络大小和尺寸因每个输入模型和比例而异。4. 网络描述符编码和匹配本节首先介绍BIND在其网中描述的两个主要特征，对象的内部齐次空间和它的边。然后，通过精心设计的真值表将二进制网络层编码为位序列，并最终使用我们独特的逻辑操作技术进行匹配，以纳入电阻属性，如比例，边缘极性和遮挡。4.1. 内部模型对象均匀掩码无纹理物体丰富的一个明显特征是其内部均匀区域。然而，这些空白空间通常被现代无纹理检测器忽略[3，4，8，16]。由于干扰物与场景中的空白空间交互，因此，在BIND中，我们提倡使用内部同质性最小封闭框（青色）封装检测到的轮廓（粉色）。(d)k-means颜色聚类图(e)迭代最小包围盒外部线条以获得背景聚类颜色。（f）由封闭框内的非背景颜色得出的最终内部均匀掩模不可渗透的边缘方向。类似于最先进的作品，如[3，4，8]，BIND在其加密器核心中采用基于成对这是通过以下方式实现的：首先检测包含来自第3.1节中的细线创建集群的定向像素的块，然后将这些占用的块中心转换为指向其内部最具影响力的细线方向的单位向量，最后将它们与原始细线向量配对。这种聚合导致块中心处的矢量连接，具有可供选择的各种角度。BOLD[4]和BORDER[3]中使用的最先进的基元基于单位向量的梯度方向计算角度，以增加方向独特性。然而，将矢量定向方向嵌入到基元中的一个主要缺陷是对极性偏移的敏感性，由此对象的不同区域处的对比背景导致梯度指向相反的方向。由于这会导致损坏并降低连续性，BIND选择了一个线方向不变的图元，以始终采用结合线对的较小（锐角）角度，作为我们网络描述的一个关键特征这样做是通过生成用于精确指示模型对象内的空间的均匀掩模MH如图所4，MH是通过首先应用α= arccos|我的天|ǁtijǁΣ、（四）简单的分割程序（图。4d）例如k均值颜色聚类[35]，然后沿着封闭框的外部线迭代[33]以收集背景颜色标签（图4d）。4e），并最终分配一个'1'的任何未收集的标签内的框，以表示对象的内部解剖结构（图。第4f段）。请注意，由于模型对象和训练背景之间的良好对比，这个过程在我们的实验中非常有效，这已经是鲁棒模型描述的先决条件4.2. 原始的角度可以说，无纹理物体共振的最一致的信息是它的噪音和照明其中·表示点积t，m表示单位i受方向影响的块中点的向量通过其最渗透的小线，tij是指原始网络-小线中点之间的连接线，并且0 ≤ α ≤ 90是指m i和t i j之间的较小角度，其表示最终的线方向不变角度基元，其最终将被二进制编码以创建BIND。图图5示出了中点块到线方向不变角度基元的变换4.3. 二进制网络编码如第3.2节所述，二进制网络被堆叠成n个网络层，以在关联时形成2n个.207202角T α（i）=1MH（Cb（i））=1Σ Σ Σ Σ111表1：BIND的3层二进制净比特组合。网络层的块索引位置N2（i）、N 1（i）、N 0（i）基于其块的占用条件被分配二进制序列。空块呈现空α= α，而角度占用块被量化为角度范围。标签T和Q分别指示比特序列是否可分配给训练块或查询块。注意，最终状态“111”仅适用于具有α的训练块。=和它的中心Cb（i）*+表示在模型的均匀掩模中MH（Cb（i））=1图像条件N2（i）N1（i）N0（i）Σ ΣT α（i）=Σ ΣMH（Cb（i））= 0图5：（a）封装目标区域的8×8二进制网络的示例。每个被占用块（四）随机选择的极性不变角度原始示例之间的T、Q60毫米≤α（i）75μ m<1 0 1原点线中点分别到块9、16、24和33一个linelet。因此，确定最佳描述符独特性和内存管理所需的总状态是至关重要的。在BIND中，我们设计并实验验证了1，使用3个网络层（N2，N1，N0）来编码8个状态的信息是最有效的，因为更多的层不仅增加了内存负载，而且还增加了量化的效果。下面的段落总结了每个状态的位组合，表1详细说明了BIND均匀状态（仅模型）每当一个块封装了一个空的对象空间，如第4.1节中模型的内部均匀掩码M H所标记的这仅在模型网络层中进行编码，以指示对象用于匹配期间的遮挡假设。空白状态对于非对象区域，由模型的内部均匀遮罩指示的任何外部空块位置这也适用于所有场景对于由定向像素占据的块，单位向量将最终在其中心达到顶点以形成如所描述的角度基元α在第4.2节。为了将α转换为二进制状态，在其角度限制[，π]内量化为6个均匀分布的π12范围分配给6个二进制状态之一（描述符存储结构由于BIND因此，为了减少用于编码空白状态的冗余空间对每个网络层采用字节索引存储结构，1图见BIND数据库。见第8页T，Q75<$≤α（i）≤90<$1 1 0包含至少一个非“000”状态）与其字节索引一起存储在成对结构中。总的来说，这种结构提供了显着减少描述符存储（约50%）和匹配速度，由于较少的空白状态迭代没有影响BIND4.4. BIND匹配为了比较模型和场景网络层之间的位序列，我们对相同编号的层和字节索引应用各种逐位逻辑运算，然后最终形成单个位串，用于总位计数评分。然而，为了减轻遮挡阻力，使用模型的均匀状态（“111”）和场景的角度图元状态的先验遮挡评估该闭塞评估评分由下式确定，OH=（T2<$T1<$T0）<$（Q2<$Q1<$Q0），（5）k−1SOH=OH（i），（6）i=0时其中，T1和T2分别表示阵列范围的按位AND和OR，T2、T1、T0和Q2、Q1、Q0指的是调度的特定训练和查询网络的层为了进行比较，对于包含查询角度原语的每个列车内部同构位置，具有指示“1”的总块索引大小k的单层输出OH块，并且总遮挡分数S0H揭示了该特定净比较中的总遮挡块。然后，足够低的遮挡分数通过以下方式激活角度基元评分过程，OP=（T2<$Q2）<$（T1<$Q1）<$（T0<$Q0），（7）MP=（T2<$T1<$T0）<$（Q2<$Q1<$Q0），（8$%9一个9t9j$%（一不（）（）j$%2#a2#TJ一&&$%&&（一）（b）第（1）款Qα（i）=α000T、Q0≤α（i）15<001T、Q15μ≤α（i）30μ<010T、30μ≤α（i）45μ<0112073）2074开始开始NN1N$端端. . . . . .. . .开始开始NN1N$端端. . . . . .. . .端开始NN1N$NN1N$开始端. . . . . .. . .1×）8. . . . . .. . .模型网（8×8）场景网（1（×1（）模型网（8×8）场景网（1（×1（）模型网（8×8）场景网（1（×1（）NN&N1N1N$N$1× 1）&(a) 尺度不变匹配1×）8(b) 遮挡净减匹配1× 1*&(c) 极性不变匹配图图6：BIND的匹配过程示例：（a）缩放，其中固定大小的场景16 × 16 3层网络与缩小的8 × 8网络匹配以产生单个二进制字符串，（b）抗遮挡过程，其中模型网络减少其部分子集以与大场景网络的类似大小的中间部分匹配，以及（c）极性反转，其中所有网络比较都匹配两个方向。kΣ−1ΣΣOP（i）SP=i=0P、SOH≤λhmdel，（9）模型0，否则其中，XNOR表示XNOR或图图7：与部分提取的净匹配示例，其中发现遮挡过高。粉红色的盒子代表（α（i））），用于标准化原始总得分（0.25）截面提取子集，以及绿色、黄色和得到SP。手动调整的参数称为遮挡因子0<λ≤1，并且总均匀模型净块h模型基本上调节了对纹理严重区域的匹配，同时允许均匀性中的轻微遮挡尽管BIND启用λ以进行灵活调整，但最好根据场景中对象的预期遮挡来指定λ然而，作为参考，我们发现λ = 0。5在我们所有的实验数据库中保持了良好的平衡与传统的描述符，BIND不同的描述符尺寸为每个输入模型场景对。这是在3.2节中定义的，其中块宽度w块保持不变，而净宽度w净符合模型长边的两倍。这种独特的框架使BIND能够通过我们称之为分段提取匹配的技术来整合各种不变属性，其中使用最大规模的模型网络来描述场景关键点，并使用大型场景网络的较小/相等的网络子集来训练和匹配模型。缩放不变性为了处理缩放，将模型从最大值缩小以形成金字塔，并在每个级别重复进行细线检测以重新对齐关键点这是由于在不同尺度下的线消失/偏移。这种缩小规模的趋势也产生了几个较小的子集的最大的网络，这是通过部分提取技术相匹配。图6a示出了与大场景网的子集匹配的缩小的模型网。遮挡处理对于具有高遮挡的匹配实例，使得同质性或角度基元分数是不期望的，即，SOH> λh 模型或SP<λ模型，BIND继续从方程（1）和（2）进行比较。5-9，减少部分子集，以获得更好的分数。我们灰色方框表示定向的、内部均匀的，背景/无匹配块。已设计了具有={0}的净迭代。75，0。5，0。25}，但只有在这些较小的子集包含足够的定向块的条件下，即P′k模型> P′ k P模型，其中P′k模型是简化模型网块9次迭代。总的来说，这使得即使在高遮挡下也能够匹配信息丰富的对象区域。用于阻塞处理的减少的截面匹配的示例可以在图2A和2B中看到。6b和7。极性不变性在4.2节中提到，由于背景对比度，尤其是在复杂的场景中，线性方向非常容易受到极性偏移的影响。因此，由于第3.2节中的线网对齐是在单一方向上，我们通过反转模型的块序列并重新应用方程来抵消这一点。5-9对于每个净比较，取两个方向中较好的分数。这种双向匹配过程在所有网络比较中都适用，同样也适用于所有分段缩减网络匹配。图6c示出了用于极性不变性的双向匹配过程。5. BIND对象识别流水线本节概述了用于识别无纹理对象的BIND管道。该算法首先检测小线中点（第3.1节），由于其高精度和抗遮挡特性，小线中点被用作关键点。这将应用于多尺度金字塔模型图像，但只有一次用于原始场景2075(a) MOD(b) D-无纹理(c) CMU-KO 8单(d) CMU-KO 8多功能(e) 平均运行时间图8：所有实验数据库的结果，包括探测器的每个图像的平均时间(a)（b）第（1）款图9：MOD形象接下来，来自每个金字塔级别的封闭框形成模型二元网（第3.2节），同时为场景描述分配最大的网大小。接下来，模型金字塔的每一层都生成自己的内部均匀掩码（第4.1节），用于无纹理空间编码。随后，网络被三层化，与每个关键点方向对齐，并在使用表进行二进制编码之前识别其块的内部均匀性和角度基元（第4.2节）1（第4.3节）。最后，在匹配阶段（第4.4节），将每个比例的模型网络与大型场景网络进行比较，并使用几何验证技术进行验证[36，37]。6. 实验与评价为了评估BIND在无纹理对象识别方面的整体能力，我们采用了几种与其质量密切相关的算法。对于专门用于无纹理对象检测的技术，我们采用了最先进的作品，例如BORDER [3]和BOLD [4]的基于线的方法，以及LINE-2D [16]的基于模板匹配的方案。此外，由于BIND也可以归类为基于二进制关键点的检测器，因此我们已经包括了标准检测器，如SIFT [1]及其基于二进制的替代ORB [7]。所有提到的算法，包括BIND，都是使用8GB的Intel双核i7 Haswell处理器实现的。的内存，并在C++编码与他们的默认库和建议的设置提供了各自的作品。共评估了3个无纹理对象数据库，其中两个是公开的，一个是由于无纹理对象类别中的选项有限而自行贡献的。Messy Office Desk DatasetCoinedMOD简称，这个由我们团队组装的数据库模拟了放置在普通工作站周围的高度同质的物体场景。它包含9个模型，同时在100个场景中播放。它的目的是评估算法在真实环境中的属性，如旋转，缩放，平移和独特的属性，如杂波和遮挡。此外，MOD中的各种场景中的对象被放置在随机色调的背景中，以挑战复杂环境中的算法。对于这个实验，我们将所有提到的检测器的结果合并在ROC图中，如图11所示。8a.经过分析，像SIFT和ORB这样的局部描述符产生了低于标准的性能，而基于纹理较少的解决方案优于BIND，支持整体实验。虽然BORDER、BOLD和LINE-2D也有不错的表现，但可以观察到BIND之间的明显区别，特别是在对象边缘梯度被不同区域背景扰乱的场景中。这主要是由于它们对边缘描述的梯度方向的高度依赖，而BIND的极性不变特性使其自身对这种条件免疫。图9展示了一些MOD数据库模型和一个示例场景，图10a展示了BIND在MOD数据集中的一些识别结果。D-Textureless Dataset这个数据库由BOLD的创建者[4]，由9个模型和55个模型组成。基于场景工具的图像。每个场景图像都包含多个模型，这些模型可以检查旋转、缩放、平移、遮挡和杂乱等属性的算法。我们评估了所有上述算法，并合并了它们的ROC曲线，以产生如图所示的图。8b.正如预期的那样，无纹理检测器的性能明显优于其他检测器，而BIND实现了最好的结果，比BORDER和BOLD的性能都要好。头对头分析显示，在需要高精度的情况下，BIND往往比BORDER表现得更好，而在附近有杂波的情况下，BOLD表现得更好这主要归功于BIND图10 b展示了包括网络匹配的该数据集中BIND的精度和遮挡/杂波抵抗性。CMU-KO 8数据集也称为CMU 厨房闭塞数据集通过 Hsiao 和SIFTORB边境大胆Line2D绑定筛选ORB边境大胆Line2D结合110.9rLINE2D+OCLP10.90.80.70.6边境大胆Line2D结合rLINE2D+OCLP1边境大胆Line2D结合SIFTORB边境大胆Line2D 结合3.50.90.80.70.60.50.80.70.60.90.80.732.50.50.40.60.50.420.30.20.10.50.40.31.50.40.30.20.30.20.110.20.100.50.1000000.10.20.30.40.50.60.70.80.9 100.10.20.30.40.50.60.70.80.9 100.10.20.30.40.50.60.70.80.9100.10.20.30.40.50.60.70.80.9 1假阳性率（FPR）假阳性率（FPR）每幅图像的假阳性（FPPI）每幅图像的假阳性（FPPI）真阳性率（TPR）真阳性率（TPR）真阳性率（TPR）真阳性率（TPR）平均时间（s）2076(a) BIND(b) BIND(c) BIND图10：所有三个实验数据集中BIND的识别结果示例。对于每种情况，关键点匹配以及对象检测边界框结果显示在左侧，并且网络匹配与绿色块（表示定向块）、黄色块（表示内部均匀块）和灰色块（表示背景/无匹配块）一起显示在右侧。Hebert[18]，该数据库被组装以评估LINE-2D的遮挡推理插件，以提高其在严重杂波和遮挡中的性能。出于这个原因，这个数据集主要集中在高度分散的场景中放置无纹理的对象，几乎没有注意到旋转和缩放等变化。总的来说，这个数据库包含8个厨具模型，以及800个单视点图像的2个场景分支，以及800个多视图图像，其中每个场景图像仅包含一个模型对象的实例。所有提到的算法，包括[18]创造的rLINE2D+OCLP（遮挡条件似然罚分）中的最佳结果遮挡模型，在图11和图12所示的图中评估高达1.0 FPPI的检测率。8c和8d。请注意，由于SIFT、SURF和ORB的登记率较低，其结果未包括在图中。总体而言，BIND在其自己的数据集中获得了最好的检测率，优于最先进的BORDER，甚至rLINE2D+OCLP。更仔细的检查显示，BIND的高净精度和遮挡描述性措施是在这种具有挑战性的场景中促进其优越的真阳性率的决定性因素。图10c展示了来自该数据库的一些BIND由于BIND主要是一种基于二进制的检测器，因此它自然具有快速的匹配速度。然而，它在实验中受到其高度精确的线性/描述过程的阻碍，获得了与BOLD相似的识别速度，并且比图8 e中呈现的最先进的BORDER即便如此，BIND也可以很容易地自定义以提高速度，而牺牲精度以实现实时检测。在我们的实验中，全尺寸的物体通常会收敛到一个[48×48]维的网络，与BORDER的[ 4 × 4 ] 128维[3]和BOLD的2D 12-bin直方图[4]浮动矢量描述符相比，在信息块计数方面增加了30倍的精度，并且在描述符大小方面节省了大约50-100字节（在较小的金字塔级别上更多）（使用BIND7. 结论本文提出了一种用于无纹理目标识别的多层网状二值描述子BIND。它通过三层网络设计提供精确的区域对象描述，将边缘和内部均匀空间编码为紧凑的旋转不变二进制字符串，同时在匹配阶段激发极性，尺度和遮挡阻力等属性。总之，来自三个数据库2的实验展示了BIND在各种情况下识别无纹理对象的压倒性鲁棒性。然而，由于BIND是通过其3层位组合表严格设计用于无纹理对象的，因此它在低均匀性方面不如其对应物（例如，BORDER、BOLD等）。尽管如此，我们看到BIND这项研究得到了新加坡总理办公室国家研究基金会（ National Research Foundation ， Prime MinistersOffice，Singapore）在其IDM Futures Funding Initiative和AcRF Tier 1（RG 28/15）下的部分支持。2 完整的实验结果和视频演示可在： https ： //drive.google.com/open? id=0B-vEAVo5DHXFS0FqTlNkcGJvcEk2077引用[1] D. G.洛从尺度不变的关键点中提取独特的图像特征。IJCV，60（2）：91-110，2004. 1、7[2] H. Bay，T. Tuytelaars和L. J. Van Gool Surf：加速了强大的功能。Proc. ECCV，第3951卷，第404-417页，2006年。1[3] J. Chan，J. A. Lee和K.乾Border：一种面向矩形的无纹理对象识别方法。在Proc. CVPR，2016中。一二三四七八[4] F. Tombari，A. Franchi和L.迪斯蒂法诺大胆的功能，以检测无纹理的对象。在proc ICCV，第1265-1272页，2013年。一二三四七八[5] S. 欣特施托伊塞尔角Cagniart，P S.Ilic，N.纳瓦布·斯特姆P. Fua，和V.莱珀蒂用于无纹理物体实时检测的梯度响应图PAMI，34（5）：876一、二[6] M. Calonder，V.莱佩蒂特角Strecha，和P.呸简介：二进制鲁棒独立基本特征。见ECCV，第778-792页，2010年。1[7] E. Rublee，V. Rabaud，K. Konolige和G.布拉德斯基Orb：一个有效的替代筛选或冲浪。在Proc. ICCV，第2564-2571页，2011中。1、7[8] D. Damen，P. Bunnun，A. Calway和W.马约尔-奎瓦斯三维无纹理物体的实时学习与检测：一种可扩展的方法。在proc BMVC，第23.1-23.12页，2012年。二、三、四[9] H. G Barrow，J.特南鲍姆河C. Bolles和H. C.狼参数对应和倒角匹配：两种新的图像匹配技术。IJCAI，第659-663页，1977年。2[10] G.博格福斯分层倒角匹配：参数化边缘匹配算法。PAMI，10（6）：849-865，1988. 2[11] A. Thayananthan，B. Stenger，P. H. S. Torr和R.西波拉杂乱场景中的形状上下文和倒角匹配。在Proc. CVPR，第1卷，第1 -127页，2003中。2[12] C.斯蒂格遮挡、杂波和光照不变的目标识别。国际摄影测量和遥感档案，34，2002。2[13] M. Y. Liu，O. Tuzel，A. Veeraraghavan和R.切拉帕快速定向倒角匹配。在Proc. CVPR，第1696-1703页，2010中。2[14] C. F. Olson和D. P. Huttenlocher。基于有向边缘像素匹配的自动目标识别。IEEE Trans.图像处理，6（1）：103-113，1997. 2[15] W. J·拉克里奇使用豪斯多夫距离有效地定位物体。在Proc. IJCV，第24卷，第251-270页，1997中。2[16] S.欣特施托伊塞尔河谷Lepetit，S. Ilic，P. Fua，and N.纳瓦布用于实时检测无纹理物体的主导方向模板。在proc CVPR，第2257-2264页，2010年。二、三、四、七[17] X.朋结合颜色和形状实时检测无纹理物体。计算机视觉和图像理解，第31-48页，2015年。2[18] E. Hsiao和M.赫伯特任意视点下目标检测的遮挡推理。在Proc. CVPR，第3146-3153页，2012中。二、八[19] J. I.奥谢夫斯卡我的杯子在哪里？- 真实世界图像中无纹理物体的全自动检测和识别。CAIP，第501-512页，2015年。2[20] M.乌尔里希角Wiedemann和C.斯蒂格结合尺度空间与相似度的方位图快速辨识三维物体。PAMI，34（10）：1902-1914，2012. 2[21] 费拉里湖Fevrier，F. Jurie和C.施密特用于目标检测的相邻轮廓段组。PAMI，87（3）：284-303，2007. 2[22] V. Ferrari，F. Jurie和C.施密特从图像到形状模型，用于物体检测。在proc CVPR，第284-303页，2009年。2[23] S.贝隆吉，J. Malik和J.普兹查使用形状上下文的形状匹配和物体识别。PAMI，24（4）：509-522，2002. 2[24] F. Jurie和C.施密特用于物体类别识别的尺度不变形状特征。在Proc. CVPR，第2卷，第II 90-II 96页，2004中。2[25] O. Carmichael和M.赫伯特基于形状的线状物体识别。PAMI，26（12）：1537-1552，2004. 2[26] Y.窦，M. Ye，P. Xu，L. Pei和Z.刘某基于两级快速匹配的目标检测 International Journal of Multimedia andUbiquitous Engineering，10（12）：381 2[27] R. G. von Gioi，J. Jakubowicz，J. M. Morel和G.兰德尔Lsd：一个带有错误检测控制的快速线段检测器。PAMI，32（4）：722-732，2010. 二、三[28] P. David和D.德门森利用线特征在高杂波图像中进行目标识别。在Proc. ICCV，第1581-1588页，2005中。二、三[29] G.金，M。Hebert和S.- K.公园基于线特征的无纹理室内目标识别系统的初步开发。在Proc. ICAR，第255-268页，2007中。二、三[30] M. Awais和K.米科莱奇克特征对连通用于物体识别。在Proc. ICAR，第3093-3096页，2010中。二、三[31] R. G. von Gioi，J.Jakubowicz，J.M. Morel，和G.兰德尔线段检测器。在proc IPOL，第2卷，第35-55页，2012年。3[32] A.德索尔纽克湖Moisan和J. M.莫瑞尔从完形理论到图像分析：概率方法。ISBN：0387726357。Springer，2008.3[33] J. Orourke。找到最小的封闭盒子。InternationalJournal of Computer and Information Sciences ， 14（3）：183-199，1985. 4[34] F. Perazzi，P.卡布尔，Y.Pritch和A.霍农显着过滤器：基于对比度的显着区域检测过滤。在Proc. CVPR，第733-740页，2012中。4[35] D. E. Ilea和P.F. 惠兰利用空间k-均值聚类算法进行彩色图像分割ImVIP，2006年。4[36] M. A. Fischler和R.C. 波尔斯随机样本一致性：模型拟合与图像分析和自动制图应用范例。ACM通讯，1981年。7[37] J. Chan，J. A. Lee和K.乾F-sort：一种更快的几何验证方法。在Proc. ACCV，2016年。7

下载后可阅读完整内容，剩余1页未读，立即下载