鲁棒损失用于点云配准的新度量方法

143 浏览量更新于2023-10-14 收藏 22.47MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

61380用于点云配准的鲁棒损失0邓志1 姚宇鑫1 邓柏林2 张巨勇1*01中国科学技术大学2卡迪夫大学0{zhideng,yaoyuxin}@mail.ustc.edu.cn DengB3@cardiff.ac.uk juyong@ustc.edu.cn0摘要0表面配准的性能严重依赖于用于源形状和目标形状之间对齐误差的度量。传统上，这样的度量基于源表面上的点到目标表面上最近点的点对点或点对平面距离，但由于最近点对应的不稳定性，这种度量容易失败。在本文中，我们提出了一种基于两个形状和一条随机直线的交点的新度量方法，它不假设特定的对应关系。我们通过广泛的实验证实了这种度量的有效性，包括它在单个配准问题的直接优化以及一组配准问题的无监督学习中的应用。结果表明，利用我们提出的度量的算法优于基于优化和无监督学习的现有方法。01. 引言0刚性配准通过应用刚性变换(R,t)将源形状S与目标形状T对齐，其中R∈R3×3是旋转矩阵，t∈R3是平移向量。这是许多应用中的重要任务，如3D场景重建和定位。变换通常通过最小化测量对齐误差的函数来计算。在实践中，形状通常表示为点云，并使用距离度量D(∙,∙)来衡量源表面上的点与目标表面上的对应点之间的对齐误差：0h(R, t) = �0(x, y)∈CD(�x, y), (1)0其中C是S和T之间的对应点集合，x表示变换后的x的新位置。要以这种方式执行配准，我们必须首先定义对应点。许多传统方法0*通讯作者0例如，迭代最近点（ICP）算法[6]将yσ(i)定义为xi的当前最近点，需要在每次迭代中与变换一起更新。在点云中存在噪声、异常值和部分重叠时，这样的迭代很容易陷入局部最优解。一些方法[17, 32, 13,48]为一些样本点计算局部形状描述符，并通过匹配描述符找到目标表面上的对应点。然而，这些手工设计的描述符的歧义性可能使它们难以匹配，尤其是对于带有噪声和异常值的点云。0除了点对应，等式（1）中对齐误差度量的另一个关键组成部分是对应对之间的距离度量D(∙, ∙)。传统的ICP方法[6,8]使用点对点或点对平面距离的ℓ2范数作为度量，其中D(xi,yσ(i))是xi到yσ(i)或T在yσ(i)处的切平面的欧氏距离的平方。为了适应噪声、异常值和部分重叠，其他方法[7, 5, 48,46]对距离值应用鲁棒函数，以忽略或降低错误的对应对的权重。尽管这些策略对噪声和部分重叠更具鲁棒性，但它们在某种程度上仍然依赖于正确的点对应。在这项工作中，我们提出了一种不依赖于准确点对应的对齐误差度量。我们的关键思想是用一个均匀分布在它们的边界球中的随机直线与源形状和目标形状相交。我们定位源形状和目标形状的交点，并使用它们之间的距离作为对齐误差的代理。我们应用Welsch函数[15]来获得鲁棒的度量值，并计算其期望值作为我们的对齐误差度量。与传统方法不同，我们的方法不假设特定的对应规则，同时由于直线的均匀分布，仍然能够从多个方向获得关于对齐的丰富信息。使用我们的度量，基于优化的配准不太容易陷入局部最小值，并且更有可能获得鲁棒的解决方案。最近，已经提出了各种基于深度学习的刚性配准方法[49, 39, 40, 16]。61390Chamfer距离的优化过程0我们度量的优化过程0收敛结果0收敛结果0目标源0输入0图1.我们提出了一种基于输入形状与均匀分布的随机直线之间的交点的刚性配准误差度量。上：通过最小化基于Chamfer距离的误差度量进行配准会导致次优结果。下：使用我们的新度量，优化过程对局部最小值更加鲁棒，并确定正确的对齐。0然而，它们大多数以监督方式训练网络，并需要地面真实对齐。我们提出的度量也可以用来替代地面真实标签，并允许在无标签数据上训练监督框架。它还可以微调通过监督度量训练的模型，以在真实世界的无标签数据集上使用。总之，我们的工作的主要贡献是：0•我们提出了一种新的刚性对齐误差度量，基于输入形状与均匀随机直线之间的交点，可以提高基于优化的刚性配准的鲁棒性。0•我们使用提出的度量将各种监督学习框架转化为无监督学习框架，可以在真实无标签数据上进行训练。02. 相关工作0使用线交点的几何处理过去，已经利用与直线的交点来处理和分析几何形状。在[21,22]中，作者使用与随机直线的交点来计算几何形状的表面积，从积分几何的角度来看[35]。在[30]中，提出了一种通过与均匀分布的直线相交来采样点云的方法。据我们所知，我们的工作是首次使用与随机直线的交点进行形状配准。0基于优化的配准一种经典的配准方法是迭代最近点（ICP）算法[6]，0通过交替查找最近点和更新变换来获得最优变换。已经提出了许多ICP的变体来提高其效率[8, 32, 27,31]。经典ICP的另一个问题是其对在真实世界数据中经常出现的离群点和部分重叠的鲁棒性。一些方法通过使用基于距离或法线的启发式方法来忽略一些点对来解决这个问题[47,32, 3]。另一种常见的方法是使用鲁棒度量，如ℓp-范数（p<1）[7]或Welsch函数[46]来衡量对齐误差并提高鲁棒性。其他方法从统计角度解决问题，并通过它们的高斯混合表示对点云进行对齐[25,18]。上述方法将配准问题形式化为优化问题，并使用数值求解器搜索局部最小值，需要适当的初始化。其他一些方法将全局优化问题形式化，并通过分支定界[43]或半定松弛[24,10,20]来解决。它们在计算上更昂贵，尤其是在大规模问题上。一些方法通过匹配局部形状描述符[14, 33,34]来对齐点云。然而，这种手工制作描述符的质量可能会受到点密度和离群点的影响。0基于学习的配准最近，提出了各种基于深度学习的配准方法。PointNetLK[4]使用迭代框架，将PointNet特征[28]和Lucas-Kanade算法[23]相结合。DCP[39]利用子网络来解决经典ICP流程中的困难，通过使用DGCNN [41]提取和合并局部特征来改进点云的特征。D(xi, yσ(i)) +Fl(S, T ) = wlxllD(xli, ylσl(i)) +yllD(xlρl(j), ylj) ,σl(i) = arg mink∥xli − ylk∥, ρl(j) = arg mink∥xlk − ylj∥,2a large difference between the numbers of its intersectionpoints with the two shapes, which may indicate an erroneouscorrespondence between them along the line. Finally, thealignment error between S and T is defined as the expectedvalue of Fl(S, T ) over the distribution of the lines:h(S, T ) = E(Fl(S, T )).(4)61400RPM-Net[44]通过学习空间坐标和局部几何来提取混合特征，并使用可微分的Sinkhorn层和退火来获得软对应关系。PR-Net[40]使用Gumbel-Softmax与直通梯度估计来获得尖锐且近似可微的映射函数。MFG[38]将形状特征和空间坐标结合起来，独立地引导对应搜索并融合匹配结果以获得完整匹配。DGR[9]使用可微分框架对真实世界的3D扫描进行成对配准，通过添加优化模块来微调加权Procrustes求解器产生的对齐结果。上述方法都是以监督方式训练模型，这限制了它们在真实世界无标签数据上的应用。最近，FMR[16]采用半监督方法进行点云配准，通过最小化特征度量投影误差。在本文中，我们提出了一种适用于无监督学习的新的配准误差度量，其结果比FMR中使用的度量更好。03. 算法03.1. 问题陈述0点云配准通常被看作是一个优化问题。考虑源表面 S上的两个点云 X = { x i } m i =1 和目标表面 T 上的两个点云Y = { y j } n j =1 ，其中 x i , y j ∈ R 3 是点。令 � X = { � x i} m i =1 表示通过刚性变换（ R ， t ）变形的源点云，其中0� x i = Rx i + t .0使用公式（1）给出的配准误差，可以描述基于ICP的方法为：0( R � , t � ) = arg min ( R , t )0x i ∈ X D ( � x i , yσ ( i ) ) ,0其中 σ ( i ) 表示点 x i 在 Y中对应点的索引。上述公式仅考虑了源点云到目标点云的距离。考虑到目标到源的距离，Chamfer距离也被用来度量两个点云之间的偏差[11,16]。基于Chamfer距离的配准误差可以表示为：0h ( � X , Y ) = �0y j ∈ Y D ( � x ρ ( j ) , yj ) , (2)0其中 ρ ( j ) 表示点 y j 在 X 中对应点的索引。选择 σ ( ∙ ) 和ρ ( ∙ ) 可以影响配准的质量。在基于ICP的方法中，y σ ( i )被选择为最接近 x i的点。但是当存在较大的最近点对应错误时，这种最近点对应通常是不正确的。0两个点云之间存在错配或重叠率低。因此，我们希望使用一种不假设预定义点对应规则的配准误差，同时能够有效地指导配准。我们的关键观察是，对于完全对齐的两个形状，任何与一个形状相交的直线也将与另一个形状相交于相同的点。当两个形状接近时，它们与同一条直线的相交点也会彼此接近。此外，如果我们使用一组随机直线与两个形状相交，那么每条直线上的相交点可以告诉我们关于两个形状之间差异的信息，该视点沿着与该直线对应的视线。在过去，这样的随机直线已经被用于积分几何来确定给定形状的几何特性，如表面积[21,22]。在接下来，我们提出了一种基于与随机直线相交的配准误差度量。03.2. 基于线交点的误差度量0为了度量源形状 S 和目标形状 T之间的配准误差，我们的基本思想是使用一组均匀分布的随机直线与两个形状相交，并比较每条直线上的相交点。具体而言，给定与两个形状相交的一条直线 l，我们将与源形状和目标形状的相交点集合分别表示为 S l= { x l i } 和 T l = { y l j }。然后我们通过以下公式度量两组相交点之间的偏差：0(3) 其中D是一个将在后面解释的误差度量，即y l σ l ( i )是T l中距离x li最近的点，x l ρ l ( j )是S l中距离y l j最近的点。权重w l 定义为w l =02 | )。这减小了具有两个形状的交点数之间差异较大的直线的权重，这可能表明它们之间的对应关系是错误的。最后，S和T之间的对齐误差定义为F l ( S , T)在直线分布上的期望值：0为了在点云配准中应用这个方法，我们计算公式（4）中的误差度量，用于变换后的源点云�X和目标点云Y，并将其作为基于优化的方法的目标函数，或者作为基于学习的方法的损失函数项。接下来，我们将介绍在点云上评估误差度量的详细过程。D(x, y) = ψν(∥x − y∥2),(5)Sr(u, α) = (r1 − u2 cos α, r1 − u2 sin α, ru),p′0 =�p∈N (p0) dppp∈N (p0) dp,(6)𝛿p1𝑑1p2𝑑2𝛿p0′p0p𝑛𝒩: p𝑐𝑎𝑛−𝑖𝑛𝑠𝑒𝑐: p𝑛𝑜𝑛−𝑠𝑒𝑐: 𝒩: p𝑠𝑜𝑓𝑡𝑒𝑛−𝑖𝑛𝑠𝑒𝑐(𝑎)(𝑏)(𝑐)61410在公式（3）中选择D在公式（3）中，我们有效地建立了源形状和目标形状上沿直线的点之间的对应关系。然而，由于直线是随机选择的，对应关系可能不准确。因此，我们定义D为一个鲁棒的度量，以减轻不准确对应和异常值的影响。我们选择Welsch函数作为度量：0其中，ν >0是一个参数，用于考虑输入点云的尺度。我们设置ν =ν0dmed，其中dmed是所有对应点对之间的中位距离，ν0是用户指定的参数。我们在所有实验中选择固定的ν0。我们将ν视为优化/训练过程中的常数项，并且不计算/反向传播其梯度。dmed的值在每次迭代中根据最新的对齐情况进行更新。0随机直线的生成根据[22]，我们首先计算一个包含源点云和目标点云的边界球Sr。然后，在Sr上均匀采样两个独立的点，并将它们连接起来生成一个随机直线。球上的每个点可以被参数化为：0其中，r是半径，u ∈ [−1, 1]，α ∈ [0,2π)。球上的随机点通过在其定义域[22]中均匀采样参数u和α来生成。在每次优化或训练的迭代中，我们使用这种方法生成15000条直线。0由于点云包含底层形状的离散样本，与底层形状相交的直线不一定与点云中的点相交。因此，我们使用以下步骤来近似直线与底层形状的交点（见图2）。首先，类似于[22]，我们将直线扩大为以直线为中心、半径为δ的圆柱体，并将圆柱体内的所有点作为交点的候选点（图2(b)）。然后，对于每个候选点p0，其在点云中的k个最近邻点也是候选点，我们计算p0和其k个最近邻点的凸组合作为交点（图2(c)）：0其中集合 N ( p 0 ) 包含 p 0 及其 k 个最近邻点，d p 是点 p到直线的距离。在我们的实现中，我们设置 k = 2，并选择 δ = √03 2 d nei 其中 d nei 是整个点云中点与其 k个最近邻点之间的平均距离。0图2. 生成点云与直线相交过程的示意图。 (a)显示了局部点云和直线； (b) 显示了候选点的选择（黑点）； (c)显示了软化候选点以获得最终相交点（红点）。04. 实验0在本节中，我们将我们的对齐误差度量应用于不同的配准问题，包括基于优化和基于学习的方法，并在合成和真实数据集上进行测试，以验证其有效性。04.1. 数据集0合成数据集我们的合成数据集是从ModelNet40数据集[42]和Axyz-pose人体数据集[1]生成的。ModelNet40数据集包含来自40个人工物体类别的CAD模型。我们从Airplane类别中选择625个案例构建一个Airline数据集，随机抽取500个案例进行训练，剩下的125个用于测试。Axyz-pose人体数据集包含110个穿着衣物的人体网格模型。我们随机选择110个模型构建一个Human数据集，使用100个模型作为训练集，剩下的10个作为测试集。使用上述数据集，我们生成用于训练和测试的点云对。为了使生成的点云类似于RGBD相机捕捉到的数据类型，我们使用以下步骤生成数据。首先，我们从不同的角度对完整模型进行采样，生成部分重叠的数据。具体来说，我们选择一个特定的轴，围绕它旋转一个想象的相机，以获得N个相机位置，旋转角度间隔为固定间隔（对于Human数据集，我们将N设置为50，对于Airplane数据集，我们将N设置为18）。然后，我们将每个相机位置上的模型的可见部分保存为源点云。对于Airplane数据集的每个源点云，我们将相机随机旋转一个角度，范围为[-75°，75°]，相对于一个随机轴，将可见部分保存为相应的目标点云。对于Human数据集，我们使用整个模型构建目标点云。然后，我们将每个点云对缩放到[-1,1]3范围内。其次，我们生成源点云和目标点云之间的复合变换。我们遵循[39]的方法，在范围[0,45°]内采样三个欧拉角旋转和范围[-0.2, 0.2]内采样平移。MethodErrR(degrees)Errt (·10−1)(ℓ1, ℓ2)Errpw (·10−1)(ℓ1, ℓ2)CD5.8630.148, 0.1320.151, 0.14CD-W (ν0 = 0.5)4.840.086, 0.078 0.108, 0.087Ours0.5760.017, 0.013 0.018, 0.015ErrR = ∠(R−1GT ˆR),Errt = ∥tGT − ˆt∥∗,Errpw =1|X|�xi∈X∥RGTxi + tGT − ˆRxi − ˆt∥∗,(7)1https://github.com/chrischoy/DeepGlobalRegistrationFRICPFGRCDOursInputICP0.610.400.460.050.681.232.090.510.031.392https://github.com/yaoyx689/Fast-Robust-ICP3https://github.com/intel-isl/FastGlobalRegistration61420表1. 在Human数据集[1]上比较不同基于优化的方法。0ICP [6] 10.015 0.139, 0.093 0.112, 0.082 FRICP[46] 6.001 0.096, 0.064 0.074, 0.054 FGR [48]46.31 0.411, 0.274 0.616, 0.410在每个轴上进行平移。总共，Airplane数据集包含9000对用于训练和2250对用于测试，而Human数据集包含5000对用于训练和500对用于测试。对于每个点云，我们使用PCL计算点法线[2]，并使用FPS [29]采样1024个点。0真实数据集为了在未标记的数据上测试我们的度量方法，我们还基于3D-Match数据集[45]、7scenes数据集[36]和RGB-DSLAM数据集[37]构建了一个真实数据集。不可避免地，我们的度量方法无法处理具有任意姿态差异和重叠比例的点云对。在实践中，姿态差异极大或重叠比例极小是不常见的。因此，我们分别从RGB-DSLAM数据集和7scenes数据集中选择相隔20帧的点云对。对于3D-Match数据集，我们从[9]中收集了预处理的数据对，其中重叠比例大于70%。所有点云对都被缩放到[-5,5]的范围内。最后，真实数据集被分为8000对用于训练和2000对用于测试。与合成数据集类似，我们计算点法线并对每个点云采样2048个点。0评估标准我们使用由[44]启发的各向同性旋转误差 Err R和平移误差 Err t，以及点对点误差 Err pw来评估点云配准的准确性：0其中 R GT 和 t GT 是真实的旋转和平移，ˆ R 和 ˆ t 是计算得到的旋转和平移， ∠ ( A ) =arccos( tr ( A ) − 102 ) 是旋转矩阵 A 的角度，| X | 是源点云 X 中的点数，∥ ∙∥ � 是0图3.使用不同基于优化的方法在Human数据集[1]上进行配准结果的比较。0ℓ 1 -范数或ℓ 2-范数。我们使用这些度量的均值来衡量方法在基准数据集上的性能。在本节和补充材料中的图中，每个结果下面的数字是使用ℓ 2 -范数的点对点误差。04.2. 我们的度量方法的有效性0与基于优化的方法的比较我们使用Adam优化器[19]在Pytorch[26]中将刚性变换的李代数表示作为目标函数，使用我们的度量方法。使用Human测试数据集作为基准，我们将我们的结果与其他基于优化的方法进行比较，包括ICP[6]、FRICP[46]和FGR[48]及其开源实现23。我们还将与使用Eq.(2)中的Chamfer距离作为目标函数的两种优化方法进行比较，其中指标D选择为欧氏距离（表示为CD）和Welsch函数（表示为CD-W，更多细节请参见补充材料）。表1显示了不同方法在Human测试数据集上的性能。我们可以看到，我们提出的度量方法可以生成比其他传统优化方法更准确的结果。图3显示了不同方法的一些配准结果示例，其中其他方法收敛到次优局部最小值，而我们的度量方法导致更准确的配准。图4和图5进一步说明了我们的度量方法在避免局部最小值方面的有效性。在图4中，我们将其他基于优化的方法的收敛结果作为优化使用我们的度量方法作为目标函数的初始化。点对点ℓ 2误差的绘图显示，我们的方法通常可以进一步减小配准误差，这表明它具有逃逸局部最小值的能力。 0 20 40 60 801000123Sample120.4820.274, 0.1750.419, 0.276Sample25.2010.151, 0.0930.117, 0.07561430误差pw0ICP FRICP CD0CD-W 我们0ICP-r FRICP-r0CD-r CD-W-r0ICP0CD0CD-W0FRICP-r0FRICP0ICP-r0CD-W-r0CD-r0我们0输入0图4. 我们采用不同基于优化的方法的收敛结果（在ℓ2 Errpw-plot中显示为实心点）来初始化我们度量方法的最小化（用�-r表示，其中�是原始方法）。在四个案例中，我们的优化方法从原始方法的局部最小值中逃脱，并进一步减小Err pw。0原始源点云和目标点云0ICP0FRICP0CD0CD-W0我们00.20 平均误差pw0方法0α-recall(%)0误差pw0ICPFRICPCDCD-W我们0图5.不同基于优化的方法在一对具有100个随机初始对齐的点云上的α-recall率和平均ℓ2-Errpw。使用我们的度量方法进行优化对初始化不太敏感。0从其他方法的局部最小值中脱离出来。图5展示了我们的方法对初始对齐的鲁棒性。我们使用从斯坦福3D扫描库[4]中的Dragon模型生成的一对点云，并对其中一个应用随机变换来得到100个不同的初始对齐。然后我们使用不同的方法进行配准，并比较它们在不同α值下的α-recall率|Sα|/|S|，其中|S|是测试案例的总数，|Sα|是点对点ℓ2误差小于α的测试案例的数量[48]（即对于给定的α，较大的α-recall率表示更好的性能）。α-recall图以及平均ℓ2点对点误差显示我们的方法对初始化不太敏感。04 http://graphics.stanford.edu/data/3Dscanrep/0表2.使用我们的度量方法在Human数据集[1]上进行优化，包括一种替代的直线交点方法(Insec1)，两种替代的直线采样方法(Sample1和Sample2)，以及不同的ν0值。0方法误差R(度) 误差t(∙10−1) (ℓ1, ℓ2) 误差pw(∙10−1)(ℓ1, ℓ2)0Insec1 (ν0 = 0.5) 49.27 0.831, 0.744 1.175, 0.7720ν0 = 100 7.786 0.289, 0.191 0.292, 0.195 ν0 = 108.181 0.288, 0.190 0.291, 0.194 ν0 = 1 2.8140.044, 0.029 0.051, 0.034 ν0 = 0.01 10.814 0.326,0.217 0.334, 0.2230我们(ν0 = 0.5) 0.576 0.017, 0.011 0.018, 0.0120在表2中，我们使用Human测试数据集作为基准来验证我们度量方法的不同组件的有效性。第一行显示在计算方程(6)中的交点时使用凸组合是重要的。这里Insec1表示一种替代方法，我们简单地将所有候选点作为最终的交点，这导致性能比我们的方法差(显示在最后一行)。第二行和第三行显示了两种随机直线采样方法(Sample1和Sample2)。对于Sample1，我们在边界框中均匀采样一个点，并均匀采样一个方向，然后构造一条通过采样点沿着采样方向的直线。对于Sample2，我们分别从源点云和目标点云中均匀采样一个点，并进行均匀的小扰动，然后将它们连接起来得到一条直线。这两种方法都被我们的采样方法(最后一行)超越。第四行到第七行显示了不同ν值对我们度量方法的影响。对于Welsch函数，较大的ν使其更接近ℓ2范数，而较小的ν使其更接近ℓ0范数。结果表明选择接近0.5的ν0是合适的。04.3. 无监督学习的结果0我们还使用了基于深度学习的配准方法提出的度量标准。具体来说，我们在DCP [39]，FMR [16]和RPM-Net[44]的框架中替换了损失函数中的对齐项，并以无监督的方式进行训练。我们将结果与使用相同数据和地面真实对齐标签训练的原始框架进行比较（分别表示为DCP-GT，FMR-GT和RPM-GT）。为了比较，我们还包括了使用ℓ2距离作为对齐项的DCP和RPM-Net的无监督变体。MethodErrR(degrees)Errt (·10−1)(ℓ1, ℓ2)Errpw (·10−1)(ℓ1, ℓ2)DCP-GT2.2810.067, 0.0440.073, 0.05DCP-CD6.6120.165, 0.110.198, 0.139DCP-Ours3.8080.082, 0.0560.093, 0.063FMR-GT1.9770.086, 0.0550.099, 0.065FMR-CD5.8190.215, 0.1530.247, 0.19FMR-Ours2.510.117, 0.0760.134, 0.091RPM-GT2.190.041, 0.0340.043,0.03RPM-CD2.7910.103, 0.0890.102,0.083RPM-Ours1.6730.042, 0.0340.045, 0.031MethodErrR(degrees)Errt (·10−1)(ℓ1, ℓ2)Errpw (·10−1)(ℓ1, ℓ2)DCP-GT3.8410.061, 0.0390.068, 0.046DCP-CD7.0210.185, 0.1140.193, 0.130DCP-Ours4.8410.07, 0.0460.079, 0.054FMR-GT2.1220.058, 0.0390.064, 0.043FMR-CD6.2070.187, 0.1230.228, 0.134FMR-Ours1.5210.089, 0.0510.091, 0.063RPM-GT1.9210.030, 0.0210.033, 0.023RPM-CD8.3730.197, 0.160.193,0.133RPM-Ours1.330.032, 0.0240.034, 0.023RPM-CD0.460.22DCP-GT0.23RPM-Ours0.21FMR-Ours0.21FMR-CD0.50FMR-GT0.21ICPFGRFRICPRPMGTOurs2.420.420.600.400.170.041.300.140.210.340.350.2761440表3. 在飞机数据集[42]上比较不同基于优化和基于学习的方法。0ICP [6] 7.223 0.131, 0.087 0.136, 0.105 FRICP [46]6.91 0.076, 0.051 0.123, 0.094 FGR [48] 13.72 0.099,0.065 0.156, 0.1140表4. 在人体数据集[1]上比较不同基于学习的方法。0ment term, as well as the semi-supervised version of FMRfrom [16] (denoted as DCP-CD, RPM-CD and FMR-CD re-spectively). For all frameworks, we replace the batchnormal- ization with the group normalization forbetter-unsupervised training. For the unsupervisedvariants of RPM-Net, we set the weights of theregularization term and the alignment term to 10 and 1respectively, and the learning rate to 2 × 10−6. For theunsupervised variants of DCP, we set the weights of thecycle term and the alignment term to 0.01 and 1.0respectively, and the learning rate to 10−5. For the unsu-pervised variant of FMR, we set the weights of the encoderterm and the alignment term to 0.001 and 1 respectively,and the learning rate to 10−5. All frameworks are trainedusing the Adam optimizer from Pytorch for 50 epochs, ona workstation with two Intel Xeon Silver 4110 CPUs at 2.10GHz, and four Tesla V100 GPUs.0输入0DCP-CD0.520RPM-GT0DCP-Ours0.300FGR1.800ICP1.190FRICP1.450图6. 使用不同方法在人体数据集[1]上的配准结果示例。0DCP0CD0输入0FMR0图7. 使用不同方法在飞机数据集[42]上的配准结果示例。0与监督学习不同，训练无监督模型通常需要合适的初始化[12]。我们使用以下步骤为合成数据集导出初始化。在预处理过程中，我们首先生成一个包含100个数据对的较简单数据集，源点云和目标点云之间的姿态差异较小，并在其上训练模型500个epochs以获得过拟合模型。然后我们在训练数据集的10%上训练模型。最后，我们以降低的学习率在整个训练数据集上训练模型。对于真实数据集，我们在预处理过程中生成一个包含较少帧之间分离的配对的较简单数据集，而其余的训练过程与合成数据集相同。表3和表4显示了在FMR-CD7.5590.469, 0.340.531, 0.384FMR-Ours3.2630.089, 0.0650.101, 0.075View1View261450表5. 不同基于优化和无监督学习方法在真实数据集上的比较。0方法 Err R (度) Err t ( ∙ 10 − 1 ) ( ℓ 1 , ℓ 2 ) Err pw (∙ 10 − 1 ) ( ℓ 1 , ℓ 2 )0ICP [ 6 ] 17.98 0.337, 0.23 0.238, 0.194 FRICP [ 46 ]11.08 0.199, 0.139 0.151, 0.112 FGR [ 48 ] 12.790.211, 0.142 0.260, 0.210RPM-CD 11.28 0.342, 0.246 0.376, 0.272 RPM-Ours2.972 0.057, 0.04 0.068, 0.050FRICP: 2.410RPM-CD: 2.440FRICP: 1.330RPM-CD:1.680FGR: 0.230RPM-Ours: 0.170FGR: 2.320RPM-Ours: 0.160FMR-Ours: 0.160ICP: 1.240FMR-Ours: 0.180ICP: 2.580FMR-CD: 2.440输入0FMR-CD: 1.580输入0图8. 在真实数据集上使用不同度量方法的深度学习框架的比较。0飞机数据集和人体数据集，分别。他们表明，我们的度量方法适用于无监督深度学习框架，并且与使用Chamfer距离的无监督变体相比具有更好的性能，甚至在某些情况下比有监督版本的性能更好。特别是对于FMR，使用我们的度量方法来改进原始的无监督框架大大提高了性能。图6和图7分别展示了在人体数据集和飞机数据集上使用不同方法的配准结果。对于这两个问题，基于优化的方法会收敛到局部最小值。使用我们的度量方法的无监督学习方法产生比使用Chamfer距离的对应方法更好的对齐效果。表5和图8比较了不同方法在我们的真实数据集上的性能。由于缺乏地面真实对齐标签，有监督学习方法不再适用。如图8所示，基于ICP的方法-0输入我们的 ICP FRICP CD CD-W0图9.使用我们的度量方法进行优化的一个失败案例，以及其他方法的结果。0由于对初始值敏感，ods [46,6]的方法容易陷入局部最小值，而[48]中的基于特征的方法在真实数据中由于噪声法线表现不佳。使用我们的度量方法的无监督学习比Chamfer距离更稳健，并在这个基准测试中表现最好。05. 结论和未来工作0我们提出了一种新的点云配准度量方法。我们工作的主要贡献有两个方面。首先，所提出的度量方法基于空间中均匀随机直线的交点，可以获得更丰富的信息，并更有可能达到全局最小值。其次，我们提出的度量方法可以将各种有监督学习框架转化为无监督学习，并且能够在大规模真实无标签适当数据集上进行训练。大量的消融研究验证了我们度量方法的各个组成部分的有效性。在合成和真实数据集上的实验证明，我们的度量方法与之前的度量方法相比具有竞争力，并可以用于深度学习框架的损失函数。图9展示了我们度量方法的一个失败案例：在将一个杯子的两个点云的对称体对齐后，我们的方法无法对齐手柄。这是因为在一组随机采样的直线中，只有少数几条会击中手柄，而它们的对齐效果会被倾向于保持当前对齐的其他直线所主导。未来的研究可能的一个方向是进一步研究为什么所提出的度量方法能够实现更好的性能。我们的猜测是，与随机直线的交点引入了优化过程的随机性，并帮助求解器逃离局部最小值。这在我们的实验中已经观察到，但需要更严格的研究来验证和理解。另一个潜在的方向是使用相关的数学理论，如积分几何来解释我们的度量方法，这可能是一个具有挑战性和有趣的未来工作。0致谢：本工作得到国家自然科学基金委员会（NSFC）（No.62122071），中国科学院青年创新促进会（No.2018495），中央高校基本科研业务费（No.WK3470000021）和广东国际科技合作项目（No.2021A0505030009）的支持。61460参考文献0[1] 人类数据集. https://secure.axyz-design.com//访问日期：2021年3月4日. 4 , 5 , 6 , 70[2] 点云库. https://github.com/PointCloudLibrary/pcl//访问日期：2021年3月4日. 50[3] 3D点集的鲁棒欧几里德对齐：修剪的迭代最近点算法.图像与视觉计算，23(3):299-309，2005. 20[4] Yasuhiro Aoki，Hunter Goforth，Rangaprasad ArunSrivatsan和Simon Lucey.Pointnetlk：使用Pointnet进行鲁棒高效的点云配准.在IEEE计算机视觉和模式识别（CVPR）会议上，2019年6月. 20[5] Per Bergström和Ove Edlund.使用迭代加权最小二乘法进行点集的鲁棒配准.计算优化和应用，58(3):543-561，2014. 10[6] P. J. Besl和N. D. McKay. 一种用于3D形状配准的方法.IEEE模式分析与机器智能交易，14(2):239-256，1992. 1 , 2 , 5, 7 , 80[7] Sofien Bouaziz，Andrea Tagliasacchi和Mark Pauly.稀疏迭代最近点.计算机图形学论坛（几何处理研讨会），32(5):1-11，2013. 1 , 20[8] Yang Chen和G ´ erard Medioni.通过注册多个范围图像进行对象建模.图像和视觉计算，10(3):145-155，1992. 1 , 20[9] Christopher Choy，Wei Dong和Vladlen Koltun.深度全局配准.在IEEE计算机视觉和模式识别（CVPR）会议上，2020年. 3 , 50[10] Nadav Dym，Haggai Maron和Yaron Lipman.DS++：一种用于匹配问题的灵活，可扩展且可证明紧密的松弛方法. ACM图形学交易（TOG），36(6):184:1-184:14，2017. 20[11] Haoqiang Fan

下载后可阅读完整内容，剩余1页未读，立即下载