基于相关滤波器的高速CF跟踪器fdKCF*:无边界效应，高定位精度

110 浏览量更新于2023-10-12 收藏 1.28MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

4020无边界效应的郑林宇，唐明，陈莹莹，王金桥，卢汉青中国科学院自动化研究所模式识别国家重点实验室，中国科学院大学，北京{linyu.zheng，tangm，yingying.chen，jqwang，luhq}@ nlpr.ia.ac.cn摘要近年来，基于相关滤波器的跟踪器（CF跟踪器）由于其出色的性能而受到广泛关注然而，大多数CF跟踪器在通过放松边界效应或利用高维深度特征来追求更高的定位精度时遭受低帧每秒（fps）。为了实现真正的-移位-100虚拟Shift-100移位-50虚拟Shift-50基础样本偏移+50偏移+100实虚虚基础样本偏移+50偏移+100时间跟踪速度，同时保持高定位AC，虚拟房房房虚拟curacy，在本文中，我们提出了一种新的CF跟踪器，fd-KCF *，它抛弃了流行的加速工具，即，所有现有CF跟踪器所采用的快速傅立叶变换，并利用实数（即，学习型区域学习型区域学习型区域学习区域学习区域非循环）和密集样本来有效地构建k-房房房房房ernel矩阵我们的fdKCF* 具有以下三个优点。（i）它在核空间和空间域中有效地训练，没有边界效应。（ii）其fps几乎与特征通道的数量无关。因此，它几乎是实时的，即，24 fps的OTB-2015，即使采用了高维深特征。 (iii) 它的定位精度是最先进的。在 OTB-2013、OTB-2015、VOT 2016和VOT 2017四个公共基准测试中进行的大量实验表明，拟议的fdKCF* 实现了最先进的本地化性能，速度明显快于C-COT和ECO。1. 介绍视觉目标跟踪是计算机视觉中的基本问题之一，有着广泛的应用。在无模型跟踪问题中，目标是估计状态（例如，位置和大小）的目标在整个图像序列中的初始帧[45，46]。无模型跟踪是非常具有挑战性的，因为跟踪器必须从非常有限的训练样本中学习鲁棒的外观模型，以抵抗极其具有挑战性的干扰，例如遮挡、大的外观变化、照明变化、快速运动和背景杂波。一般来说，无模型跟踪的关键问题是如何构造一个不仅能容忍外观变化的图1：KCF [22]（第1行），BACF [24]（第2行）和我们的fdKCF*（最后一行）中采样方法的比较KCF的训练样本来自基础样本的循环移位（即，学习区域），并且除了基本区域之外，它们都是虚拟的BACF通过裁剪KCF所有训练样本的中间部分来获得目标大小的训练样本（青色框），其中一些是虚拟的。与它们不同的是，在fdKCF* 中，目标大小（红框）的训练样本是以传统的滑动窗口方式从学习区域中密集采样的，并且它们都是真实的。我们称我们的采样方法为实密采样。目标，但也排除背景干扰，同时保持尽可能快的处理速度。近年来，基于相关滤波器的跟踪器（CF跟踪器）由于其出色的性能而受到广泛关注。自MOSSE [3]以来，几乎所有的CF跟踪器[22，39，18，28，10，1，12，13，14，24，8，31]都是可靠的，采用快速傅里叶变换（FFT）来加速它们的计算。不幸的是，虽然现代CF跟踪器我们认为，造成这一现象的原因有以下两一方面，为了提高跟踪算法本身的鲁棒性，一些代表性的CF跟踪器[12，24]利用技术来放松由FFT [3]引入的边界效应。然而，这些技术不可避免地破坏了训练样本的整个周期性，导致训练速度慢得多。另一方面，为了提高特征的鲁棒性，4021学习型区域搜索区域区域大小：样本量：图2：说明冗余计算的线性核矩阵的brute-force的方法的decomposition- tion。颜色边界框是三对实样本和密集样本，·表示点积，并且红色五角星和红色点分别是实线和虚线样本共享的C相同颜色的两个样本被视为一对，因为实心样本中的红色五角星的相对位置与虚线样本中的红点的相对位置在这个例子中，我们必须计算三次红五角星和红点的点积在实际应用中，当采用密集实样本和蛮力法时，需要计算上述点积h×w次。相比之下，我们的fCKM只计算一次。目标的外观变化，现代CF跟踪器采用总是高维的深特征虽然这些跟踪器从深度特征中受益显着，但它们的计算成本显着增加。特别是，C-COT [14]不仅放松了边界效应，而且还采用了深特征，可以仅在0.GPU上的3fps。此外，尽管已经采用了许多技术来加速其计算，但ECO [8]只能以6fps运行。自然地，人们问我们是否可以设计一种能够有效地放松或甚至避免固有的边界效应的CF跟踪器，即，不使用FFT来加速其训练，同时有效地利用深层特征？为了解决上述问题，本文提出了一种新的CF跟踪器，fdKCF*，它不仅没有固有的边界效应，而且即使使用深度特征也可以实时运行。首先，介绍了实采样和密采样方法，从根本上避免了边界效应.如图1，该采样方法基于传统的滑动窗口，其中所有训练样本都是真实的，它不同于现有CF跟踪器中使用的基于循环移位的采样方法，如KCF [22]和BACF [24]，其中训练集包含虚拟样本，导致负边界效应。其次，我们设计了一种新的算法，fCKM，在空间域中有效地构造核矩阵，即使在高维深度特征被采用后，调查的真实和密集的样本之间固有的高重叠。最后，基于高斯-赛德尔迭代法，有效地优化对偶空间。由于实样本和稠密样本之间的高度重叠，使用蛮力法构造核矩阵时存在大量冗余计算以线性内核为例。给出了学习区域的H×W×C特征图，检测区域，其中C是通道数，我们必须计算任意两个C维特征向量的点积，这两个特征向量分别来自两个特征图，K次，其中K是分别包含上述两个特征向量的样本对的数目。实际上，这个点积只需要计算一次。图2示出了示例。受此启发，我们提出了一种新的算法fCKM，它通过消除冗余计算，任何两个C维特征向量的点积仅计算一次，而不是K次。 fCKM进行以下两个步骤来构造线性核的矩阵：（i）分别从输入的两个特征图中选取任意两个C维特征向量，建立其点积值表;(ii)通过查表和求和获得线性核矩阵中的每个元素。这样，任意两个C维特征向量的点积的冗余计算可以用查表代替，其时间复杂度为O（1），而不是暴力法中的O（C）因此，fCKM具有以下两个优点：(i)它是在空间域中进行的，没有边界效应。(ii)它的运行速度快，对特征通道的数量不敏感。在我们的实验中，只需要几毫秒就可以构建线性克尔矩阵，NEL即使功能频道的数量高达1024。此外，它还可以用来构造许多典型的非线性核矩阵，而几乎没有增加通过修改第一步骤并在第二步骤之后添加非线性映射，实验在四个公共基准上进行：OTB-2013、OTB-2015、VOT 2016和VOT 2017。我们fdKCF* 实现了最先进的本地化性能，同时以24fps运行作为一个公平的比较，当C-COT [14]和fdKCF* 采用相同维度的深度特征，在相同的GPU上运行，并且不使用任何其他加速技术时，fdKCF*fdKCF* 的平均fps约为 C-COT的80倍据我们所知，我们的fdKCF* 是第一款同时实现高定位精度和实时速度的CF跟踪器。2. 相关工作KCF [21，22]第一次建立了相关滤波器和岭回归之间的关系.与MOSSE算法相比，KCF算法在核空间或对偶空间建模，在不增加参数的情况下，可以利用多通道特征。此外，KCF的另一个重要贡献是在频域快速计算核矩阵。为了提高KCF的定位性能，HCF [30]在KCF中引入了更高维度的深度特征，但边界效应成为其定位性能的瓶颈。我们4022、、、i=1ZXZXi=1XX˜2˜fdKCF* 也在内核或对偶空间中建模。它与KCF和HCF的区别主要体现在两个方面.首先，我们的fdKCF* 的样本是真实的（即，noncyclic）和密集的，而不是一个真正的基础样本的循环移位，在KCF和HCF（见图。①的人。换句话说，在我们的fdKCF* 中没有固有的边界效应，而KCF和HCF则受到边界效应的影响。因此，我们的fdKCF* 的本地化性能大大超过HCF（约为 OTB-2013 和 OTB-2015 的 10% ）。其次，我们的fdKCF* 通过利用实样本和密集样本之间固有的高重叠在空间域中加速，而不是像KCF和HCF那样在频域中加速。值得注意的是，与HCF相比，我们的fdKCF* 的跟踪速度要快得多（24 fps，GPU上的11 fps），即使fdKCF* 的搜索区域大于 HCF （ 4 vs. 1.8 倍目标大小），并且fdKCF* 不利用循环样本结构来加速。通过利用真实和密集样本，LSART [37]求解KCF的对偶变量与线性内核通过传播消息向前和向后在一个学习型区域特征图特征提取样品图3：特征图X中的采样（绿色长方体）。Sam-plesxi|i=1…什... N是通过使用实数和稠密采样方法获得的（见图1）。1）其中W=W−w+1，N=（H−h+ 1）×（W−w+ 1）。详见第3节。同样，其中h≤H和w≤W分别是目标特征图的高度和宽度，N=（H-h+1）×（W-w+1）。此外，我们定义核矩阵KZX如下：κ（z1， x1）···κ（z1， xN）网络它不显式地构造核矩阵。KZX=1000. . ..中国，（1）与LSART不同，我们的fdKCF* 构建了内核首先是矩阵，然后通过iter求解对偶变量κ（zN，x1）· ·· κ（zN，xN）其中κ（·，·）是核。 KXX是革兰氏矩阵，积极的方法我们的fdKCF* 的效率非常高，高于LSART，原因有两关于{xi}N我们将使用KL如果Z=X。在其余的这pa-和KG表示的线性和首先，为了求解对偶变量，每次更新因为它们需要在LSART的网络中向前和向后传播消息，并且这是耗时的。而在我们的fdKCF* 中，我们只通过我们的fCKM构造一次核函数，然后通过迭代方法求解对偶变量这两个步骤都是有效的。二是只有分别以κ L（zi，xj）=<$zi，xj<$$>和κ G（zi，xj）=g（zi，xj）为元素的高斯核矩阵，其中g（·，·）为高斯函数.根据等式(1)KCF的优化问题无边界效应（KCF*）可以在对偶空间中表示为：一阶收敛的方法，如SGD，可以是EM-在LSART中使用，而更有效的，如高斯-最小值−KXXααα2+λαTKXXα，（2）Seidel可用于我们的fdKCF*。值得注意的是LSART只能采用线性核，而非线性核也可以在我们的fdKCF* 中采用。此外，基于暹罗网络的跟踪器[2，27，20]近年来实现了最先进的性能。他们将跟踪视为相似性学习问题，并通过大量离线数据训练他们的模型为了完整起见，我们还将我们的fdKCF* 与实验中的典型fdKCF*进行了比较。3. 无边界效应KCF其中y=[y1，y2，...， yN]是高斯标签的向量，λ是正则化参数，α ∈ R N×1是对偶变量的向量。问题（2）的优化解可以表示为：α=（KXX+ λI）−1y。（三）此外，给定X和α，Z中的检测过程可以表示为f（Z）= KZXα<$.（四）显然，为了计算方程中的αε(3)，我们有我们将从核岭回归问题开始用{xi}N构造KXX先构建KXX，[22]第24话，让读者为之动容。岭回归和核岭回归之间的关系设X∈RH×W×C和Z∈RH×W×C为有限单元，学习区域和搜索区域的真实地图，其中H和W分别是特征图的高度和宽度，C是通道的数量。然而，当密集样本并且在N和C通常较大的情况下采用深特征例如，当构造KL时，其每个元素κ（xi，xj）必须通过以下公式计算：κ（xi，xj）=xi，xjh−1w −1C −1所有训练样本{xi}N其中xi∈Rh×w×C是=X中国（5）i=1从X处取样，如图3所示，所有测试样品m=0n=0d=0i/W4023{zi}N其中zi∈Rh×w×C是从·X轴，i=1j/W4024˜XXZX.Σ˜˜q=(⌊j/W⌋+m)×W+(jmodW)+n,.Σ.ΣΣ ΣΣZXd=0ΣZXm，n，dd=0i，j，d其中W=W−w+1，Xp，q，d是X的元素在第p行、第q列和第d通道处。因此，我们认为，(2) 构造求和矩阵。通过查表构造求和矩阵S∈RN×N的时间复杂度构造K-L方程。(5)是基表T和求和。具体地说，O. N2Chwh 设H=βh，H=W，h−1w −1h= w，并将N替换为（H −h+1）×（W −w+1）。然后，上述复杂度可以简化为O1.一 Cβ4h6S（i，j）=N（p，q），（8）m=0n =0注意，这种复杂性是非常高的，因为h和C通常分别属于10和10- 3数量级，当采用深特征时。4. 核矩阵的快速计算（fCKM）在本节中，我们首先介绍我们的新算法哪里p=（i/W+m）×W+（imodW）+n，W=W−w+1。（九）fCKM的有效构造KZX，然后展示它如何与线性核和高斯核作为两种特殊情况。最后，分析了fCKM的复杂性，并将其与暴力方法进行4.1. 通用内核的fCKM我们的fCKM可以有效地构造核矩阵，其中核κ（·，·）可以表示为因此，对于所有的（i，j），S（i，j）=<$−1（κ（zi，xj））。这一步的时间复杂度是Oβ4h6。(3) 映射. （φ，φ）核的KZX∈RN×N可通过S与函数φ（·）的映射得到.具体地说，KZX（i，j）= K（S（i，j））.（十）因此，对于所有（i，j），KZX（i，j）=κ（zi，xj）。的.h−1w−1C−1κ（z，x）=该步骤的时间复杂度为O γβ4h4。根据上述步骤，可得到<$C−1φ（Z，X）对于m=0n=0d=0其中，φ（·）和φ（·，·）分别是时间复杂度为O（γ）和O（η）的函数，z∈Rh×w×C，all（m，n，i，j）仅计算一次，而不是K次，在构造（k，φ）核的KZX时，我们的fCKM具有很高的效率。zm，n，d是z的第m行第n列的元素，最后，我们要讨论的关键区别是-Tween KII [23]和我们的fCKM。简而言之，KII需要评估-第d频道。我们称这样的κ（·，·）为（κ，φ）核。从图中可以看出2和图3、最任何样本的元素也是其空间上相邻的实样本和密集样本的元素。这样大的共享元素将导致用蛮力法构造（φ，φ）核的KZX时产生大量的冗余计算，即计算κ（zi，xj）的（六）、这是因为有K对样本，（z，x）证明了贡献函数是否满足充分必要条件，并且它只能加速单个滤波器的滤波，而不能加速一组高度重叠的滤波器的滤波。然而，我们的fCKM专注于加速这样一组过滤器的过滤。4.2. 线性核矩阵的fCKM（x，φ）核是线性的，如果x，φ（x，y）= xy.因此，可以构造线性核矩阵KLZm，n，n是第m行的C有效地使用fCKM。具体而言，根据第4.1节，L和Z的第n列，导致<$C−1φ（Zm，n，d，Xi，j，d）KZX可以通过以下两个步骤构造。（1）如下构建基表TL必须计算K次。为了减少这些冗余计算，我们设计了一种新的算法fCKM来控制，C−1结构K ZX （φ，φ）核的有效性。我们的fCKM包括以下三个步骤。(1) 构建基础表。基表T ∈ R HW×HW的（φ，φ）核的构造表达式为：C−1d=0(2) 构造求和矩阵SL，其中等式(8)，其中T在等式中被替换为TL。11个国家。最后，KL= SLT（i，j）= φ.Zd=0j/W，Xi/W，imodW，dφ（zm，n，d，xm，n，d）、（6）TL（i，j）Z j/W，jmodW，dX i/W，imod W，d.（十一）Σ4025因此，对于所有m，n，di，j，d，T包含φ（Z，X）.ΣΣ。（七）因为x（x）= x。4.3. 高斯核矩阵的fCKMC1d=0（m，n，i，j），并且任何一个仅计算一次。该步骤的时间复杂度为OηCβ4h4+Cβ4h4。1这里，为了方便起见，我们在本文中使用β而不是β − 1，这是合理的，因为一般情况下β ∈ [4，5][14，18，12，8，11，13]。不仅线性核，而且许多常用的非线性核，如高斯核、多二次核和S形核，都是（φ，φ）核。高斯核是CF跟踪器中最常用的核，它用来说明fCKM如何构造高斯核矩阵。4026Σ−FLOPsZXΣ。ZXZX√Σ.ΣZX..ΣΣ.Σ3ZXZX不不σ2ZXZXt t−1，j=0，（15a）如果φ（x）= exp，则（φ，φ）核是高斯核。 √x和×1011FLOPs的线性内核14φ（x，y）=（x-y）2. 因此，高斯核矩阵12用fCKM可以有效地构造G。具体-10根据第4.1节，KG以下三个步骤。可以通过8个6(1) 按如下方式构建基表TG42C−1TG（i，j）=Zd=0j/W-Xi/W，imodW，dΣ200 100 200 300 400 500 600特征通道（十二）(2) 构造求和矩阵SG，其中等式(8)、图4：我们的fCKM和蛮力方法的计算量之间的比较，(5)在计算其中T在等式中被替换为TG。12个。（3）将SG映射到KG.√Σ−即，线性核矩阵KL其中H=W= 60且h=w= 15。G （i，j）=exp。−SG（i，j）σ2.（十三）当H=W=60，h=w=15，C=600时，我们的fCKM所需的时间约为8。8ms，而蛮力方法的约为600ms。另一方面，fCKM具有OH2W2更高的空间4.4. 复杂性分析在本节中，我们详细分析和比较了采用线性内核时fCKM与蛮力方法的时间和空间复杂度根据Sec。4.1，使用Eq. (6)而构造（φ，φ）核的核矩阵KZX的fKCM分别为O（ηCβ4h6+Cβ4h6+γβ4h4）和O（ηCβ4h4+Cβ4h4+γ β 4h4）复杂性而不是蛮力方法。这种额外空间的需求用于存储基表T。但是，它在当前的GPU和RAM上可以忽略不计。例如，fCKM只需要50MB以上的蛮力方法下H=W=60和浮点数据类型。5. 无边界效应的快速深KCF5.1. 快速训练β4h6+ γβ4h4）。因此，KL可以在时间复杂度为OC β 4 h6和OC β 4 h4 + β 4 h6的条件下，用E- q的蛮力法构造了一个新的时间复杂度为OCβ 4 h6和OC β4 h4+ β 4 h6的时间复杂度为O Cβ 4h6和O Cβ 4 h4 + β4 h6的时间复杂度为O C β 4 h4 + β 4 h6. (5)和我们的fKCM，因为φ（·，·）和φ（·）的时间复杂度分别为O（1）和O（0），即，η=1且γ=0。此外，它们的比例关系为：节中3、我们已经展示了如何有效地进行反...其中Xt是帧t中的X。直接利用方程（1）求最优α_（？）(3)但由于矩阵求逆的时间复杂度为ON3，因此计算量很大. 虽然α-消元法是通过求解一个线性方程组来实现的，Cβ4 h6CH2H2方法的复杂度仍然是O（1N3）。为了实现Cβ4h4+β4h6=C+h2=1+h2/C（14）实际上，当采用高维深特征时，C > h2<$h<$1。所以，时间是--更有效地，我们采用基于Gauss-Seidel的迭代方法[12]。具体地说，我们将KXtXt + λI分解为下三角形Lt和严格上三角形Ut，即 KXtXt+λI=Lt+Ut。那么，απt可以构建KL的复杂性通过暴力手段可以通过以下迭代表达式有效地求解：大约是我们的fKCM的h2倍图4示出了我们的fCKM对减少计算成本与蛮力方法常见的H=W= 60和h=w= 15，α（j）←ααt（j）← Lt\.y−Utα<$（j−1）<$，j>0，（15b）如果特征的单元大小（步幅）为4×4，则是这种情况。从图中可以得出结论，当通道数量增加时，FLOP随fCKM的增量为比蛮力法慢得多，通道数越多，fCKM的加速越大。因此，我们的fCKM可以有效地构建KL，即使利用高维的深层特征。例如，在TITAN X GPU上，当典型H=穷举法我们的fCKMKK其中，x=expXσ2无论C是什么，执行步骤（2）总是需要4ms在那里-4027.ΣW = 60且h = w = 15时，步骤（1）随着C增加1仅增加8µs，其中j表示迭代次数，αt−1是第t−1帧的最优解。实际上，5次迭代就可以得到满意的解ααt。注意，这种迭代方法是有效的，因为Eq.(15b)可以解决算法的时间复杂度为O（N2）。与KCF相比，很容易知道KCF算法构造核矩阵和求解线性方程组的时间复杂度分别为O Cβ2h2log（βh）和O（N），明显低于我们4028˜˜.ΣΣ.Σ.ΣfdKCF*。这是因为KCF利用循环样本，导致负边界效应。5.2. 更新为了实现目标的鲁棒定位，需要对跟踪器的感知模型进行与其他CF跟踪器类似[18，38，22]，我们在第二节更新Xt5.1通过下面的线性加权方法，即，功能. 与C-COT [14]类似，我们的fdKCF* 仅使用深度特征来显示算法本身的性能。具体来说，我们采用在ImageNet [16]上训练的VGG-M-BN [4]我们首先将Conv-2和Conv-5的原始步长从2改为1，以提高定位精度。然后，将Conv-1的输出映射以及随后的具有核大小2×2和步幅2×2的平均池化层用作浅层特征（96个通道），并且将Conv-5的输出映射以及随后的具有核大小2× 2和步幅2X1 = X1，Xt=（1−δ）Xt−1+δXt，t>1，（十六）采用双线性插值层作为深层特征（512通道）。结果，浅能级特征和深能级特征都是4×4单元尺寸（步幅）。其中Xt是帧t中学习区域的实际采样特征图，δ是学习速率。5.3. 快速多尺度检测采用基于比例金字塔的方法[28]来定位目标对象并同时估计其适当比例。具体来说，给定X，α，和尺度金字塔，参数我们设置不同的学习率（第二节）。5.2)用于浅能级特征和深能级特征。具体地，δ = δ s= 0。01，δ = δ d= 0. 005深的人等式中的正则化参数λ 2设置为0。01. 方程中的最大迭代次数j 15设置为5。类似于SRDCF [12]，我们将方形采样区域的图像面积设置为目标面积的42倍，ZiSi=1 检测区域的特征图，其中S是如果它的面积小于200 μ2则它被重新缩放到200μ 2的面积，并且如果其面积大于2402，则为240 2的面积。金字塔的层次性，目标的快速检测每个尺度上的对象可以表示为fZi=KZiXα，i.（17）注意，任何（φ，φ）核都可以在等式（17）中使用。（17）。特别地，如果（φ，φ）核是线性的，则最佳尺度以及目标位置可以实现与更多有效的方法。也就是说，Nw =α（i）xi，（18a）i=1fZi=Ziwi，i，（18 b）其中α（i）是α的第i个元素，α·表示·在H×W维上的DFT。在对·进行DFT之前，如果·的维数小于H ×W，则将0填充到·的右下角，使其维数为H×W。当量(18)比Eq更有效(17)在具有线性（λ，φ）核的多尺度检测的情况下，因为等式(18a)只执行一次。6. 实验我们在四个公共基准上评估我们的fdKCF*，即OTB-2013 [45]，OTB-2015 [46]，VOT 2016 [26]和VOT2017 [25]，并将其性能与最先进的和代表性的跟踪器进行比较。在所有的实验比较中，fd- KCF*的所有参数6.1. 实现细节平台我们的fCKM是用C++实现的，fdKCF *的其余部分是用PyTorch实现的。实验是在Linux上用单个TITAN X GPU进行的4029缩放。为了平衡定位精度和跟踪速度，我们设置了5级尺度金字塔（Sec.5.3）。内核在我们当前的实验中，我们仅采用fdKCF* 中的线性内核。原因是（1）大多数国家-最先进的CF跟踪器，如BACF [18]和ECO [8]，只能采用线性内核，（2）具有线性内核的fdKCF* 比具有高斯内核的运行稍快。6.2. OTB数据集评价在 OTB-2013 和 OTB-2015 实验中，我们分别将fdKCF* 与最先进的CF跟踪器和非CF跟踪器进行了比较。当与CF追踪器进行比较时，遵循OTB-2015 [46]中的标准基准协议，通过五个指标对所有追踪器进行定量评估，即精度图、成功图、距离精度（DP）、重叠精度（OP）和AUC。此外，如[32]所指出的，OTB-2015中DP的定义是有缺陷的，因为它对边界框的大小敏感，他们提出了归一化精度P范数来衡量定位精度。基于他们的工作，我们用P范数@0评估所有跟踪器。2，其被计算为视频中P范数小于0的帧的百分比。二、当与非CF跟踪器比较时，所有跟踪器都通过AUC度量进行定量评估，因为它们都在原始文件中报告AUC，并且无法获得其中一些跟踪器的详细跟踪结果以使用其他度量进行评估。与CF跟踪器比较。我们将最先进的CF跟踪器分为两组进行彻底的比较。第一组由七个跟踪器组成，以实时速度，即，超过 20 fps 。这些跟踪器是MKCFup [39]，BACF [18]，ECO-HC [8]，LCT [31]，Sta-403010.90.80.70.60.50.40.30.20.10OTB-2013上的精密度图fdKCF*[0.908]BACF [0.858]ECO-HC [0.856]LCT [0.845]MKCFup [0.837]CFNet [0.769]吻合钉[0.762]DSST [0.736]051015202530354045 50中心误差阈值10.90.80.70.60.50.40.30.20.10OTB-2013上的成功图fdKCF*[0.705]BACF [0.669]经济-HC [0.657]MKCF上升[0.640]LCT [0.602]吻合钉[0.592]CFNet [0.592]DSST [0.564]0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.81重叠阈值10.90.80.70.60.50.40.30.20.10OTB-2015上的精密度图fdKCF*[0.891]经济-HC [0.845]BACF [0.819]缝钉[0.770]CFNet [0.765]LCT [0.756]MKCF上[0.742]DSST [0.689]051015202530354045 50中心误差阈值10.90.80.70.60.50.40.30.20.10OTB-2015上的成功图fdKCF*[0.675]经济-HC [0.649]BACF [0.631]CFNet [0.592]MKCF上涨[0.581]吻合钉[0.581]LCT [0.533]DSST [0.528]0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.81重叠阈值(a) 与实时CF跟踪器的比较。10.90.80.70.60.50.40.30.20.10OTB-2013上的精密度图ECO [0.910]fdKCF*[0.908]C-COT [0.887]HCF [0.887]GPRT [0.867]SRDCFDecon [0.850]SRDCF [0.835]深度SRDCF [0.826]051015202530354045 50中心误差阈值10.90.80.70.60.50.40.30.20.10OTB-2013上的成功图[0.711]fdKCF*[0.705]C-COT [0.678]GPRT [0.677]SRDCFDecon [0.654]深度SRDCF [0.641]SRDCF [0.639]HCF [0.614]0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.81重叠阈值10.90.80.70.60.50.40.30.20.10OTB-2015上的精密度图[0.897]fdKCF*[0.891]C-COT [0.890]GPRT [0.842]深度SRDCF [0.837]HCF [0.837]SRDCFDecon [0.812]SRDCF [0.782]051015202530354045 50中心误差阈值10.90.80.70.60.50.40.30.20.10OTB-2015上的成功图[0.697]C-COT [0.679]fdKCF*[0.675]GPRT [0.655]深度SRDCF [0.640]SRDCFDecon [0.632]SRDCF [0.607]HCF [0.573]0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.81重叠阈值(b) 与高定位性能CF跟踪器的比较。图5：我们的fdKCF * 和（a）七个现代实时CF跟踪器的平均精度和成功曲线图，（b）七个现代CF跟踪器分别在OTB-2013和OTB-2015上产生最先进的定位精度。在图例中报告了平均距离精密度和AUCfdKCF* 远远优于所有其他实时CF跟踪器。fdKCF* MKCFup BACF ECO-HCLCT缝钉 DSST CFNetmOP-13 0.8840.7840.8410.8150.739 0.721 0.6730.742mOP-15 0.8280.6890.7760.7820.630 0.691 0.6150.731mPN-13 0.8460.7600.8160.7720.7730.711 0.6490.725mPN-15 0.8200.6840.7710.7620.691 0.720 0.6280.728（一）相比实时CF追踪器fdKCF* C-COT ECO GPRT HCF SRDCF decon deep mOP-130.8840.8210.8710.8410.7410.7850.799 0.779mOP-150.8280.8160.8420.7910.6610.7280.759 0.765极难序列的精密度图10.90.80.70.60.50.40.30.20.1005101520253035404550中心误差阈值非常困难序列的成功图10.90.80.70.60.50.40.30.20.100.10.2 0.3 0.4 0.5 0.6 0.7 0.81重叠阈值mPN-130.8460.7820.8320.8180.7830.7480.772 0.740mPN-150.8200.8050.8190.7930.7350.7130.753 0.755最大FPS-15240.3 6 51181 1(b)与高定位性能CF跟踪器的比较。表1：平均OP（mOP）和平均Pnorm@0。2（mPN）fdKCF*和（a）7个现代实时CF跟踪器，（b）7个现代CF跟踪器，可在OTB-2013和OTB-2015上实现最先进的定位精度。decon和deep分别表示为SRDCFDecon和deepSRDCF。每条线上最好的三个结果分别用红色、蓝色和洋红色表示fdKCF* 的性能远远优于所有其他实时CF跟踪器。此外，我们还在OTB-2015上报告了（b）中跟踪器的平均fps[1]，[2]，[3]，[4]，[5]。第二组由其他七个跟踪器组成，这些跟踪器具有最先进的定位精度，但不能实时运行这些跟踪器是ECO [8]，C-COT [14]，deepSRDCF[11]，SRD-[13][14][15][16][17][18][19][1图图5a和表1a显示了我们的fdKCF* 与第一组CF跟踪器的比较如图5a，我们的fdKCF* 获得90的平均DP和AUC。8%和70。5%的OTB-2013，以及89。1%，67。5%，分别在OTB- 2015上，以5. 0%，3. 6%，4.6%和2。6%，分别为-图6：我们的fdKCF* 的平均精密度和成功图，七个现代CF跟踪器，可在OTB-2015的非常困难的序列上产生最先进的定位精度[19]在图例中报告了ly.此外，如表1a所示，我们的fdKCF* 获得平均P 范数@0。平均OP为84。6%，88。百分之四在OTB-2013，以及82。0%，82。8%，分别在OTB-2015上，以3. 0%，4. 3%，4. 9%，4。6%。这些结果表明，我们的fdKCF* 在本地化性能方面明显优于所有其他最先进的实时CF跟踪器。我们认为这是因为我们高效的fdKCF* 不仅避免了固有的边界效应，而且还利用了强大的深度特征。图5 b和表1b显示了我们的fd- KCF* 与第二组CF跟踪器的比较。从图1所示的平均DP和AUC判断。如图5b所示，我们的fdKCF* 的局部化性能与C-COT的局部化性能相当，并且略差于ECO的局部化性能。然而，从平均P范数@0. 2和平均OP，如图所示在表1b中，我们的fdKCF* 的本地化性能是与ECO相比具有竞争力，明显优于C-COT。此外，如表1b的最后一行所示，我们的fdKCF* 的平均fps明显高于fdKCF*[0.789]C-COT [0.751][0.717]HCF [0.676]深度SRDCF [0.598]GPRT [0.540]SRDCFDecon [0.523]SRDCF [0.442]fdKCF*[0.495]C-COT [0.478][0.463]HCF [0.374]深度SRDCF [0.372][0.358]SRDCFDecon [0.343]SRDCF [0.287]距精度距精度重叠精度重叠精度距精度距精度重叠精度距精度重叠精度重叠精度4031其中AUC-2013 AUC-2015实时表2：我们的fdKCF* 和其他最先进的非CF追踪器在OTB-2013和OTB-2015上的AUC。最好的两个结果分别以红色和蓝色显示第二组中的所有跟踪器（包括ECO），尽管在fdKCF*中不存在稀疏更新和特征维数减少，这是ECO用来加速的。我们认为，以下三个原因导致我们的fdKCF* 的本地化表现略逊于ECO。(1)ECO采用的聚类算法GMM提高了其鲁棒性，而我们的fdKCF* 中没有类似的组件（2）ECO中采用了自适应降维和不同特征加权的方法，而fdKCF* 中没有使用相似的特征分量。(3)无论是深功能和手工制作的功能，即，HOG [7]和Color-Names [15]在ECO中使用事实上，手工制作的功能可以提高跟踪器在序列上的定位性能，并且易于挑战。为了说明这一事实，Han，et al. [19]将OTB-2015的序列分为三组：根据大多数最先进的跟踪器的本地化性能，可以分为容易、困难和非常困难。不难发现，采用手工特征的跟踪器为了进一步说明上述观点，我们将fdKCF* 与第二组CF跟踪器在图2中的非常硬的序列上进行比较。6.可以看出，我们的fdKCF* 的本地化性能明显优于所有其他CF跟踪器（包括ECO）在非常困难的设置。请注意，主要使用深度功能的C- COT也优于除fdKCF* 之外的其他跟踪器。得出的结论是，采用手工制作的功能可能不会提高，但削弱本地化性能的跟踪器上非常硬的序列。与非CF跟踪器比较。我们将fdKCF* 与最先进的非CF 跟踪器进行比较，包括 SINT+ [40]，SINT++[43]， RASNet [42]， SASi-[20]第20话 SiamRPN [27]， [49]第四十九章：我的天[2019 - 04 - 15][2019 - 04 - 19][2019 - 04 - 05][2019 - 05]1TRACA [6]，FlowTrack [50]，LSART [37]，和VI-图7：VOT 2016和VOT 2017的预期平均重叠。最好的跟踪器靠近右上角。TAL [36]，关于OTB-2013和OTB-2015。表2示出了结果。可以看出，我们的fd-KCF * 的定位精度优于大多数非CF跟踪器，并且优于所有其他实时跟踪器。6.3. VOT数据集评价我们提供了包含60个序列的VOT 2016 [26]和VOT2017 [25]数据集我们遵循VOT挑战协议来计算跟踪器，其中主要报告期望平均重叠（EAO）并基于它对跟踪器进行排名。图7显示了EAO排名图，我们将fdKCF* 分别与VOT2016和VOT 2017上的前15名CF跟踪器进行了比较。这些跟踪器的性能来自VOT报告。整体而言，我们fdKCF* 的EAO得分与VOT 2016挑战赛冠军C-COT相当然而，我们的fd- KCF* 的跟踪速度明显快于C-COT和ECO。这些结论与OTB数据集上获得的结论一致。请注意，CFWCR和CFCF分别是基于ECO和C-COT的改进版本。相反，我们的fdKCF* 是一个新颖的跟踪框架，没有任何进一步的改进和技巧。7. 结论和今后的工作本文提出了一种新

下载后可阅读完整内容，剩余1页未读，立即下载