判别优化方法在点云配准中的应用

22 浏览量更新于2023-10-16 收藏 1.39MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

4104求θ，tθtx做做做ICPICPICP初始点本地最小值/固定点地面真理角更新路径判别优化：点云配准理论及应用Jayak orn Vongkulbhisal†，Fernando De laT orre，Jo a P.Costeira††ISR-IST，Universidade de Lisboa，Lisboa，葡萄牙美国宾夕法尼亚州匹兹堡卡内基梅隆大学网址：jvongkul@andrew.cmu.edu，ftorre@cs.cmu.edu，网址：www.example.com，jpc@isr.ist.utl.pt摘要干净数据损坏的数据许多计算机视觉问题被公式化为成本函数的优化。这一方法面临两个主要挑战：（1）设计在可接受解处具有局部最优值的代价函数，以及（2）开发有效的数值方法来搜索这些局部最优值中的一个（或多个）。虽然在无噪声情况下设计这样的函数是可行的，但在噪声、遮挡或缺失数据的情况下，局部最优解的稳定性和位置大多是未知的在实践中，这可能导致不期望的局部最优或在期望的地方不具有局部最优。另一方面，高维空间中的数值优化算法通常是局部的，并且通常依赖于昂贵的一阶或二阶信息来指导搜索。为了克服这些限制，本文提出了判别优化（DO），一种从数据中学习搜索方向而不需要成本函数的方法。具体来说，DO明确地学习搜索空间中的一系列更新，这些更新导致与所需解决方案相对应的固定我们提供了一个正式的分析DO，并说明其优点在2D和3D点云注册的问题，无论是在合成和范围扫描数据。我们表明，DO优于国家的最先进的算法的准确性，鲁棒性扰动和计算效率方面的一个很大的保证金。1. 介绍数学优化是解决计算机视觉中许多问题的基础。这一事实是显而易见的，因为在任何主要的计算机视觉会议中使用优化技术的论文过多。例如，摄像机校准、运动结构、跟踪或配准是被视为优化问题的传统计算机将计算机视觉问题形成为优化问题面临两个主要挑战：（1）设计成本函数图1.与ICP和DO的2D点对齐（a）数据。（b）国际比较方案成本函数的水平组合（c）提议的DO的推断水平集(d)比较方案和发展目标的趋同区域。详细描述见正文（最佳颜色）。其具有对应于适当解决方案的局部最优值。(2)选择一种高效、精确的算法来搜索参数空间。传统上，这两个步骤被独立处理，导致不同的成本函数和搜索算法。然而，在存在噪声、缺失数据或模型不准确的情况下，这种传统方法可能导致具有不期望的局部最优值或甚至在期望解中不具有最优值。考虑图图1a-左示出了在无噪声数据的情况下的2D对准问题。对于这个问题，一个好的成本函数应该具有全局最优值，(d)Conv. 区域(c)做(a)数据(b)ICP4105两个形状重叠。图1b-左图示了在完整和无噪声数据的情况下迭代最近点（ICP）算法[4]的成本函数的水平集。Ob- serve，有一个定义明确的最优值，它与地面真理硬币。给定一个成本函数，下一步是找到一个合适的算法，给定一个初始配置（绿色方块），找到一个局部最优。对于这个特定的初始化，ICP算法将收敛到地面实况（图中的红色菱形）。1 b-左），和图。1d-左显示绿色的ICP收敛区域。然而，在数据中存在扰动的现实场景中，不能保证在期望解中存在良好的局部最优解，而局部最优解的数量图1 b-中心和图1 b-中心1 b-右显示了在数据损坏的情况下ICP成本函数的水平集表示。我们可以看到成本函数的形状发生了巨大的变化：存在更多的局部最优，并且它们不一定对应于地面实况（红色菱形）。在这种情况下，在绿色方块中初始化的ICP算法将收敛到错误的最优值。重要的是要注意到，成本函数仅被设计为在理想情况下在正确的解处具有最优值，但是对于该成本函数在最优值周围的行为以及它将如何随噪声而变化知之甚少。针对上述问题，本文提出了判别优化算法. DO利用了这样一个事实，即我们经常从训练数据中知道解决方案应该在哪里，而传统方法基于理想模型来制定优化问题。DO不是遵循成本函数的下降方向，而是直接学习导致站点的更新方向序列。这些点被“设计”放置这种方法有三个主要优点。首先，由于DO这可以在图中看到。 2，其中我们示出了图2的相同示例的DO的更新方向。1.一、其次，由于DO不优化任何显式函数（例如，2配准误差），它对模型失配不太敏感，对不同类型的扰动更鲁棒图图1c示出了从由DO学习的更新方向推断1的轮廓水平可以看出，曲线水平在地面实况上具有局部最优，并且比图1中的ICP具有更少的局部最优1b. 图1d的结果表明，尽管扰动，DO的收敛区域变化不大，并且总是包含ICP的区域第三，计算更新方向，1回想一下，DO不使用成本函数。使用表面重建算法[13]从DO的更新方向适当地重建轮廓水平。对于ICP，我们使用每个参数值的最佳匹配来计算ICP2成本。求θ，t图2. 更新图中DO的方向。1杯传统的方法要求成本函数是可微的或连续的，而DO我们还证明了DO我们将我们的方法命名为DO，以反映直接学习找到稳定点而不是优化“生成”成本函数的想法我们证明了在刚性的2D和3D点云配准问题的DO的潜力具体来说，我们的目标是解决2D/3D旋转和平移，将两个点云配准在一起。使用DO，我们学习一系列方向，导致每个特定形状的解决方案在对合成数据和杂乱范围扫描数据的实验中，我们表明DO在计算时间，鲁棒性和准确性方面优于最先进的局部配准方法，如ICP [4]，GMM [14]，CPD [17]和IRLS [3]此外，我们展示了如何DO可以用来跟踪3D对象。2. 相关工作2.1. 点云配准近几十年来，点云配准一直是计算机视觉领域的一个重要问题。可以说，迭代最近点（ICP）[4]及其变体[9，18]是最知名的算法。这些方法在求解对应关系和几何变换之间交替，直到收敛。ICP的一个典型缺点是需要良好的初始化以避免坏的局部最小值。为了缓解这个问题，鲁棒点匹配（RPM）[10]使用软分配而不是二进制分配。最近，迭代重加权最小二乘（IRLS）[3]提出使用各种鲁棒成本函数来提供对离群值的鲁棒性并避免不良局部极小值。与上述基于点的方法相比，基于密度的方法将每个点建模为密度函数的中心。核相关[20]通过最大化两个点云的密度来对齐它们。相干点漂移（CPD）[17]假设一个形状的点云是由另一个形状的密度生成的，并求解最大化其可能性的参数。高斯混合模型配准（GMM-4106∗K∈克鲁克Reg）[14]最小化两个点云密度之间的L2最近，[6]使用支持向量回归来学习每个模型的新密度表示设2J：Rp→R是可微的代价函数.用于最小化J的梯度下降算法可以写为，在最小化L2误差之前的点云，而[11]模型x=x−µ∂ J（x），（1）点云是以重力为吸引力的粒子，k+1kkxk求解微分方程以获得配准。总之，先前的方法通过首先定义不同的成本函数，然后使用迭代算法（例如，期望最大化、梯度下降）。我们的方法采用了不同的视角，不定义新的成本函数，而是直接学习刚性变换参数的一系列更新，使得固定点与训练集的地面实况相匹配。2.2. 监督顺序更新（SSU）方法我们的方法的灵感来自最近的实际成功的监督顺序更新（SSU）方法的身体姿态估计和面部特征检测。级联回归[8]学习从特征到细化参数的一系列映射，以估计单个图像中目标对象的姿态。显式形状回归[7]学习一系列提升回归量，最大限度地减少搜索空间中的错误监督下降法（SDM）[23，24]学习一系列下降映射作为平均雅可比矩阵，用于求解非线性最小二乘函数。最近的工作包括学习Jacobian和Hessian矩阵[22];在SSU之后运行Gauss-Newton算法[1];以及在参数的不同区域使用不同的映射。其中xk∈Rp是步长k处的参数，µk是步长。执行该更新直到梯度消失，即，直到达到一个稳定点[5]。与梯度下降相比，其中更新是从成本函数导出的，DO从训练数据中学习更新。一个主要的优点是，没有成本函数显式优化，并考虑周围的扰动数据的解决方案的邻域时，地图学习。3.2.更新映射序列（SUM）DO使用类似于（1）的更新规则。令h：Rp→Rf是对数据的表示进行编码的函数（例如，h（x）从位置x）处的图像中提取特征。给定初始参数x0∈Rp，DO迭代更新xk，k = 0，1，. . . ，使用：xk+1=xk−Dk+1h（xk），（2）直到收敛到一个稳定点。基体3Dk+1∈Rp×f将特征h（xk）映射到一个更新向量上.矩阵Dk+1，k = 0，1，. . . 从训练数据中学习的信息形成SUM。学习SUM：假设我们得到一个训练集作为三元组的集合 { （ x（ i ）， x（ i ）， h（i））}N，其中x（i）∈Rp0i=1 0Eter space [25]. 大部分的作品都集中在面部-是第i个问题实例的初始参数（例如，标记对准和跟踪。第i个图像），x（i）∈Rp是真实参数基于以前的工作，我们提供了一个新的解释，以SSU方法作为一种学习更新步骤，使驻点对应于问题的解决方案。这导致了几个新奇。首先，我们允许（例如，对象在图像上的位置），并且h（ i ）：Rp→Rf提供第i个问题实例的信息。DO的目标是学习一系列更新映射{Dk}k它将x（i）更新为x（i）。为了学习D，我们使用0克学习映射的迭代次数是自适应的，而不是像以前的作品那样是恒定的其次，我们将DO应用于点云配准的新问题设置，最小二乘回归：1ΣND = arg minx（i）−x（i）+D（三）在这里我们展示了更新只能从合成数据此外，我们还提供了一个理论结果k+1D~N克尔克i=1关于训练数据的收敛性，并解释了为什么地图应该按顺序学习，这在以前被视为启发式[24]。3. 判别优化3.1. 梯度下降DO旨在学习一系列更新映射（SUM）以将参数的初始估计更新到站点。当与梯度下降的基本原理相在我们学习了一个映射Dk+1之后，我们使用（2）更新每个x（i），然后继续学习下一个映射。重复该过程为了理解为什么（3）学习固定点，我们可以可以看出，对于i，x（i）≠x（i），（3）将迫使Dh（i）（x（i）），2个粗体大写字母表示矩阵X，粗体小写字母表示列向量X。所有非粗体字母表示标量。0nRn是零的向量。向量xi表示X的第i列.下标[x]i表示x的第i个元素。 x在这里，我们使用线性映射来提高计算效率，但其他可以以直接的方式使用非线性回归函数34107k=1（一）k=1∗k+1kk∗算法1训练更新映射序列（SUM）3.3. 理论分析输入：{（x（i），x（i），h（i））}N，K，λ这部分提供理论分析为了做。0i =1输出：{Dk}K1：对于k=0到K−1，2：用（4）计算Dk+13：对于i=l至N，do4：更新x：=x（i）-Dk+1h（i）（x（i））。5：结束第六章：端算法2寻找一个稳定点具体来说，我们证明了在对h（i）的弱假设下，有可能学习一个SUM，它在每次迭代中严格减少训练误差。首先，我们定义在点条件下的单调性：定义1（在一点的单调性）一个函数f：Rp→Rp在一点x <$$> ∈ R p是单调的，如果它满足（x − x <$）<$f（x）≥ 0，对所有x ∈Rp。 f是严格单调的，如果等式只在x = x ≠ 0处成立。4根据上面的定义，我们可以得到以下结果：输入：x0，h，{Dk}K输出：x1：设置x：= x02：对于k=1至K，，maxIter，定理1（在更新映射序列（SUM）下训练误差的严格减少）给定训练集，{（x（i），x（i），h（i））}N，如果存在线性映射D∈3：更新x：= x −Dkh（x）第四章：端0i=1Rp×f使得，对于eac hi，Dh（i）在x（i），并且如果i= x（i）x（i），则更新规则：5：设置iter：=K+1。6：当k DKh（x）≥k且iter≤maxIter时，克x（i）∗= x（i）−Dh（i）（x（i）），（5）7：更新x：= x−DKh（x）k+1kk+1k8：更新iter：=iter+19：结束时其中Dk+1∈Rp×f从（3）中获得，保证训练误差在每次迭代中严格减小ΣNx（i）−x（i）ΣNǁ20}是场景a a−4. 点云配准的DO在m a的“前面”上的点;和S a 含有残余场景点。我们定义h：R6×R3×NS→R2NM为：本节介绍如何应用DO来配准刚性下的点云。为简单起见，本节讨论[h（x;S）]a=1Σzs∈S+exp∫1-σ2、T（sb;x）−ma、（7）配准具有不同点数的两个3D形状的情况，但该想法可以简单地扩展到2D3×NB[h（x;S）]a+NM=z一Σexp∫1-σ2、T（sb;x）−ma、（8）例设M∈RM是一个包含三维坐标的矩阵s∈S−一个形状（“模型”）的nates我们的目标是找到旋转和平移，注册S到M5。回想一下，S和M中的点之间的对应关系是未知的。4.1. 变换的参数化刚性变换通常表示为具有非线性约束的矩阵形式由于DO不允许约束，因此以这种矩阵形式参数化变换参数X是不方便的。然而，刚性变换的矩阵表示形成了一个李群，它与一个李代数相关联[12，15]。实质上，李代数是一个线性向量空间，其维数与变换的自由度相同;例如R6是三维刚性变换的李代数。李代数中的每个元素都通过指数和对数映射与李群中的元素相关联，其中存在封闭形式的计算（在补充材料中提供）。作为一个线性向量空间，李代数为x提供了一个方便的参数化，因为它不需要强制约束。注意，李代数中的多个元素可以表示李群中的相同变换，即，这种关系不是一对一的。然而，这种关系在李代数的原点附近是一对一的，这对我们的任务来说已经足够使用李代数的先前工作包括图像中的运动估计和跟踪[2，21]。4.2. 注册功能函数h编码关于待解决问题的信息，例如，它从输入数据中提取特征5将M寄存到S的变换可以通过将S寄存到M的变换逆来找到。其中z将h归一化为1，σ控制exp函数的宽度 exp项根据模型和场景点之间的距离计算权重。由于sb的权重被分配给索引a或a +N M，这取决于sb所在的m a的一侧。请注意，h是特定于模型M的，它返回一个大小为2N M的固定长度向量。这是必要的，因为h要乘以Dk，这是固定大小的矩阵。因此，所学习的SUM也特定于形状M。然而，h可以采用具有任意数量的点的场景形状S以与SUM一起使用。虽然我们没有证明，这个h符合条件的Thm。1，我们在SEC中经验地显示5、它可以有效地用于我们的工作。4.3. 特征快速计算从经验上讲，我们发现直接计算h是缓慢的，由于成对距离计算和指数的评估为了执行快速计算，我们将模型形状周围的空间划分为均匀的网格，存储在每个网格中心处计算的h值。当计算场景点T（sb; x）的特征时，我们简单地返回最接近T（sb;x）的网格中心的预先计算的特征。注意，由于网格是均匀的，所以找到最近的网格中心可以在O（1）中完成。为了在本节中获得规模感，我们假设模型是均值-减去并归一化，使最大维数在[-1，1]中。我们在[-2，2]范围内计算均匀网格，每个维度上有81我们将预先计算的特征中任何小于10−6的元素设置为0，由于大多数值为零，因此我们将它们存储在稀疏矩阵我们发现，这种方法显着减少了6至20倍的特征计算时间，同时保持相同的精度。在我们的实验中，每个形状的预计算特征需要不到50MB。'前'：n（T不1 B 1（s;x）-m）>0n1n1exp（.）M1exp（.）'Back'：n（T不1 B 1（s;x）-m）0（一）（b）第（1）款......112NM-1NMNM+1NM+22NM-12NM4110(a) 点的数量（b）噪声SD（c）初始角度（d）异常值的数量（e）不完整的场景移除部分#pt = 200，1000噪声sd = 0.02，0.1角度= 30°，90° #异常值= 100，300比率不完全= 0.2，0.7*DO的培训时间：236秒10.750.50.2510.750.50.2510.750.50.2510.750.50.2510.750.50.250100100020003000 4000数量的点101100十比一10-2100100020003000 4000数量的点0101100十比一10-20 0.04 0.08噪声SD0 0.04 0.08噪声SD0101100十比一10-20 50 100 150初始角度（度）0 50 100 150初始角度（度）0101100十比一10-20 200 400600数量的异常0 200 400600数量的异常0101100十比一10-20 0.2 0.4 0.6不完全性比率0 0.2 0.4 0.6不完全性比率图4.不同扰动下合成数据的三维配准结果。(Top)具有不同扰动的场景点的示例。（中）成功率。（下）计算时间。5. 实验本节提供了具有合成数据和距离扫描数据的3D数据的实验结果。补充文件中提供了2D情况下的实验结果所有实验都在具有16 GB内存的Intel i7-4790 3.60GHz计算机基线：我们将DO与两个基于点的AP进行了比较，[4]和IRLS [3]）和两个基于密度的AP。[ 17][18][19][19][19][19]所有方法的代码都是从作者的网站上下载的，除了ICP，我们使用MATLAB的实现。对于IRLS，使用Huber成本函数。在MATLAB中实现了DO的代码。性能指标：我们使用注册成功率和计算时间作为性能指标。当配准的模型点与地面实况定向处的对应模型点之间的平均误差小于0时，我们认为配准是成功的。05模型的训练DO算法：给定一个模型形状M，我们首先将其归一化为位于[-1，1]中，并通过从M中替换400到700个点来均匀采样来生成场景模型。然后，我们应用了以下三种类型的扰动：（1）旋转翻译：我们在85度范围内随机旋转模型，并在[-0]中添加随机平移。3，0。3.这些转换被用作地面真值x在（4）中，以x0 = 0 6作为初始化。（2）噪声和异常值：标准差为0的高斯噪声。05添加到样品中我们考虑了两种类型的离群值。首先，将0到300个点的稀疏离群值添加到[-1，1]3.其次，用0到200个点的高斯球模拟结构化离群值，标准差从0.1到0.25。这将创建一组模拟场景中其他对象（3）不完全形状：我们用这种扰动来模拟自遮挡和被其他物体遮挡。这是通过删除模型一侧的点来完成的具体来说，我们对一个3D单位向量u进行均匀采样，然后将所有样本点投影到u上，并删除投影值最高的40%到80%的点。对于所有的实验，我们产生了30000个训练样本，并为SUM训练了总共K = 30个映射，其中λ = 2×10−4（4）和σ2= 0。03，并将最大迭代次数设置为1000。5.1. 合成数据我们使用Stanford Bunny模型进行了合成实验[19]（见图4）。完整的模型包含36k个点。我们使用MATLAB我们通过改变五种类型的扰动来评估算法的性能：（1）场景点的数量范围从100到4000 [默认值=200到600];（2）噪声范围在0到0.1之间 [默认值= 0];（3）初始值和0到180度的角度[默认值= 0到60];（4）数字ICP IRLS CPD GMMReg DO计算时间（s）成功率成功率成功率计算时间（s）成功率计算时间（s）成功率计算时间（s）计算时间（s）4111ICP IRLS CPD GMMReg DO*DO的平均值训练时间：260秒。101100十比一10.750.50.2510-20 1530456075初始角度（度）00 1530456075初始角度（度）(a) 模型（b）场景（c）结果第十步步骤30步骤90第220步（最终）GroundtruthIRLSICPCPD GMMReg(d)DO（e）基线结果的登记步骤图5.与范围扫描数据的3D配准结果。(a)示出了3D模型（“chef”），以及（b）示出了3D场景的示例。除了点云，我们还包括用于可视化目的的表面渲染。(c)显示了实验的结果。(d)显示了DO的注册步骤示例。模型初始化为与地面实况方向成60度，模型的部分与其他对象相交。此外，目标对象低于70%的遮挡，这使得这是一个非常具有挑战性的情况。然而，随着迭代的进行，DO能够成功地注册模型。(e)显示了基线算法的结果。从0到600 [默认值= 0]的异常值的比率;以及（5）从0到0.7 [默认值= 0]的不完整场景形状的比率当我们扰动一个参数时，其他参数的值请注意，场景点是从原始的36k个点中采样的，而不是从M。异常值的范围为[-1]。五一[5]3. 所有生成的场景包括[-0]内的随机平移。3，0。3.每个变量设置总共运行50轮火车-DO的计算时间为236秒（包括生成训练数据和预计算特征）。试验数据和结果的例子如图所示4.第一章虽然ICP在所有情况下都需要较低的计算时间，但当扰动很高时，它的成功率很低。这是因为ICP倾向于陷入最接近其初始化的局部最小值。CPD在所有情况下都表现良好，除了当离群值的数量很高，它需要很高的计算时间。IRLS比CPD更快;然而，当模型高度不完整时，它的表现并不好GMMReg具有最宽的会聚盆，但在形状不完整时表现不佳。它也需要很长的计算时间，由于退火步骤。对于DO，其计算时间远低于基线。请注意，对于较大的初始角度，DO需要更高的计算时间，因为需要更多的迭代才能到达静止点。在成功率方面，我们可以看到DO在几乎所有的测试场景中都超过了基线这一结果是可以实现的，因为DO不依赖于任何特定的成本函数，这些成本函数通常被建模为处理几种类型的每扰动另一方面，DO学习应对来自训练数据的扰动，使其比其他方法更加鲁棒。5.2. 距离扫描数据在本节中，我们对UWA数据集进行了3D配准实验[16]。该数据集包含50个杂乱的场景，其中5个对象是使用美能达Vivid 910扫描仪以各种配置拍摄的。所有对象都被严重遮挡（60%至90%）。我们使用这个数据集在看不见的测试样本和结构化离群值下测试我们的算法该数据集包括188个地面实况姿势，用于四个目标。对象。我们在所有50个场景中使用所有四个对象进行测试。从原始模型中，使用pcdownsample对10300个点进行采样，并用作模型M（图5a）。我们还将每个场景下采样到1000个点（图1）。5 b）。我们将模型初始化为0到75 de-在[-0]内随机转换的情况下，从地面真值方向生成灰色。四，零。[4]3.我们为每个参数设置运行了50次初始化，每个数据点总共运行了50×188轮在这里，我们将ICP的内围值比率设置为50%，作为自闭塞的估计值。平均培训时间每个对象模型的DO为260秒。用DO配准的结果和示例如图所示。图5 c和图5 d。IRLS、CPR和GMMReg在几乎每个场景中的成功率都很低。这是因为结构化离群值导致许多区域具有高密度，从而为CPD和GMM创建了假最优值计算时间（s）成功率4112(a) （b）结果图6. 3D点云中的对象跟踪结果。(a)显示了水壶和帽子的3D模型。(b)显示了（顶部）3D点云中DO和ICP的跟踪结果，场景点为蓝色，（底部）为RGB图像上的重投影每列显示相同的(See补充视频）。Reg，这是基于密度的方法，也适用于IRLS，IRLS对局部极小值的敏感性低于ICP。当初始化接近解决方案时，ICP可以快速注册并提供一些正确的结果，因为它通常终止于另一方面，DO提供了比ICP显著的改进，同时保持低计算时间。我们强调，DO是用单个对象的合成示例训练的，它从未见过场景中的其他对象。该实验表明，我们可以用合成数据训练DO，并将其应用于真实场景中的对象配准。5.3. 应用于3D物体跟踪在本节中，我们将探索在3D点云中使用DO进行3D对象跟踪。我们使用微软Kinect以20 fps的速度捕获RGB和深度图像的视频，然后从深度图像重建三维场景。我们用两个重建的形状作为目标对象进行了测试：水壶和帽子。除了自遮挡之外，这两个物体都呈现出具有挑战性的场景：水壶有一个整体光滑的表面，几乎没有什么特征，而帽子是平的，使它很难捕捉从一些观点。在记录过程中，物体经历了不同的方位、遮挡等。对于这个实验，我们对深度图像进行子采样，以减少水壶视频的每5个像素的输入点和帽子视频的每10个像素的输入点。为了执行跟踪，我们手动初始化第一帧，而后续帧使用前一帧中的姿势进行初始化没有使用RGB图像的颜色。在这里，我们仅将DO与ICP进行比较，因为IRLS给出了与ICP相似的结果，但不能很好地跟踪旋转，而CPD和GMMReg未能处理场景中的结构化离群值（类似于Sec. 5.2）。图6b示出了结果的示例可以看出，即使在严重遮挡和结构化离群值下，DO也可以鲁棒地跟踪和准确地估计对象的姿态，而ICP倾向于被其他物体卡住。DO的平均计算这表明DO可以用作3D点云中的鲁棒实时对象跟踪器。结果录像作为补充材料提供。失败案例：我们发现DO在某些情况下无法跟踪目标对象，例如：（1）当对象以极高的速率被遮挡时，以及（2）当对象移动太快时。当这种情况发生时，DO要么跟踪替代目标对象位置的另一个对象，要么简单地停留在前一帧中的相同位置。6. 结论本文提出了判别优化（DO），一种通过从训练样本中学习更新方向来解决计算机视觉中参数估计的与传统方法相比，DO的主要优点包括对噪声和扰动的鲁棒性以及效率。在较弱的条件下，给出了训练数据收敛性的理论结果.在应用方面，我们证明了DO在刚性条件下的2D和3D点云配准问题中的潜力，并说明了它优于最先进的方法。未来感兴趣的工作是设计一个不特定于单个模型的特征函数除了2D/3D点云配准之外，我们相信DO可以应用于计算机视觉中更广泛的问题，例如非刚性配准，相机校准或将形状模型拟合到视频中。致谢我们要感谢Susana Brandao提供的水壶3D模型。本研究部分得到了FundacaoparaaCienciaeaTecnologia（项目FCT[UID/EEA/50009/2013] 和卡内基梅隆 - 葡萄牙项目的博士资助）、国家科学基金会（资助RI-1617953）和EU-Horizon 2020项目#731667（MULTIDRONE）的支持内容完全由作者负责，不一定代表资助机构的官方观点。重复。RGB img.3D数据做ICP做ICP4113引用[1] E. 安东纳科斯山口斯内普，G。Trigeorgis和S.Zafeiriou.自适应级联回归。在ICIP，2016年。3[2] E. Bayro-Corrochano和J.奥特加-阿吉拉尔利用单目视觉进行跟踪和三维运动估计的李代数图像和视觉计算，25（6）：907921，2007。5[3] P. Be rgstr？m和O. 埃德伦德用迭代重加权最小二乘法重建点集计算优化与应用，58（3）：543-561，2014。二、六[4] P. J. Besl 和 H.D. 麦凯一种三维形状配准方法 IEEETransactionsonPatternAnalysisandMachineIntelligence，14（2）：239-256，1992。二、六[5] S. Boyd 和 L. 范登伯格凸优化。剑桥大学出版社，2004。3[6] D. Campbell和L.彼得森一种用于鲁棒点集配准和合并的自适应数据表示。在ICCV，2015年。3[7] X. Cao，Y. Wei，F. Wen和J. Sun.用外显形状回归法进行人脸对齐. CVPR，2012。3[8] P. 多尔山口。 Welinde r和P. 佩洛娜级联姿态恢复。CVPR，2010。3[9] A.菲茨吉本 2D和3D点集的稳健配准。BMVC，2001年。2[10] S. Gold，A. Rangarajan角P. Lu，P. Suguna和E. Mjol-sness. 用于2D和3D点匹配的新算法：姿态估计和对应。Pattern Recognition，38（8）：1019-1031，1998. 2[11] V. Golyanik，S. Aziz Ali和D.斯特里克点集配准的引力方法。在CVPR，2016年。3[12] B.大厅李群、李代数和表示：基本的介绍。Springer，2004. 5[13] M. Harker和P. 最小二乘表面反射，从测量的梯度场。在CVPR中。2[14] B. Jian和B. C.维穆里基于高斯混合模型的点集配准。IEEE Transactions on Pattern Analysis and MachineIntelligence，33（8）：1633二、三、六[15] Y.马，S. Soatto，J. Kosecka，and S. S. Sastry 3-D视觉的邀请。Springer-Verlag New York，2004. 5[16] A.米安，M。Bennamoun和R.欧文斯基于局部特征的3D物体检索关键点的重复性和质量IJCV，89（2）：348-361，2010. 7[17] A. Myronenko和X.歌点集配准：相干点漂移。IEEETransactionsonPatternAnalysisandMachineIntelligence，32（12）：2262-2275，2010。二、六[18] S. Rusinkiewicz和M.勒沃ICP算法的有效变体In Proc.3rd Int.三维数字成像与建模会议，2001年。2[19] 斯坦福计算机图形实验室。斯坦福3D扫描仓库。https://graphics.stanford的网站。edu/data/3Dscanrep/，2014年8月。访问时间：2016- 08-31。6[20] Y. Tsin和T.卡纳德一种基于相关性的鲁棒点集配准方法。见ECCV，2004年。2[21] O. Tuzel，F. Porikli，和P.米尔基于李群的不变量检测和跟踪学习。CVPR，2008。5[22] G.齐米罗普洛斯投影输出级联回归及其在人脸对齐中的应用。CVPR，2015。3[23] X. Xiong和F.德拉·托雷监督下降法及其在人脸对齐中的应用。CVPR，2013。3[24] X. Xiong和F.德拉·托雷求解计算机视觉中非线性最小二乘问题的监督下降法CoRR，abs/1405.0601，2014年。三、四[25] X. Xiong和F.德拉·托雷全局监督下降方法CVPR，2015。3

下载后可阅读完整内容，剩余1页未读，立即下载