单目间接SLAM系统中基于鲁棒初始化的特征点跟踪与准确定位

117 浏览量更新于2023-10-13 收藏 1.14MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

1121基于鲁棒初始化的李相俊计算机科学与电气工程韩国韩东环球大学eowjd4@naver.com黄成秀计算机科学与电气工程韩国韩东环球大学sshwang@handong.edu摘要本文提出了一种单目间接SLAM系统，执行鲁棒的初始化和准确的定位。对于初始化，我们利用基于矩阵分解的方法。基于矩阵分解的方法要求提取的特征点必须在所有使用的帧中被跟踪。由于一致的跟踪是困难的，在具有挑战性的环境中，提出了一种几何插值，利用极几何。对于定位，使用3D线。我们建议使用Pluucker线坐标来表示线的几何信息。我们还提出了正交表示的Plu¨ cker线坐标和雅可比线更好的优化。实验结果表明，该初始化方法在线性时间内生成一致的、鲁棒的地图，即使在具有挑战性的场景中也能快速收敛。使用所提出的线表示的定位比其他最先进的方法更快，更准确，更节省内存。1. 介绍目前，视觉SLAM（同时定位和地图构建）作为增强现实、自动驾驶汽车和机器人技术的重要组成部分，已经引起了越来越多的关注。此外，单目相机已被广泛考虑用于视觉SLAM，这不仅是由于其价格低廉，而且是许多行业中广泛使用的设备。然而，单目视觉SLAM具有若干缺点，诸如尺度漂移、纯旋转等，它来自于使用单个图像来操作系统[1]。特别地，单目视觉SLAM中的地图初始化比基于传感器的SLAM更具挑战性。由于地图初始化与系统性能密切相关，因此应特别注意鲁棒初始化。间接（基于特征的）单目视觉SLAM中的常规初始化方法利用特征点通过最小化几何误差来优化系统[10，14]。这些方法找到两帧之间对应的特征点，计算相对相机姿态，然后使用它们重建3D地标。然而，从估计的基本矩阵计算的估计的相机姿态基本矩阵和单应性之间的模型选择也很棘手，如[2，10]中所讨论的。此外，高度限制的标准，如检测低视差情况和双重平面模糊性[3]导致初始化失败。此外，当初始化失败时，帧被简单地丢弃，这可能减慢收敛。相比之下，直接（基于像素的）单目视觉SLAM系统，使用逐像素匹配的光度误差最小化生成随机的初始地图，并使用连续关联的数据更新它。然而，这些方法可能会产生不稳定的结果，如[4]中所讨论的。此外，仅当通过光度校准校正输入图像时，基于Direct的方法才是准确的[5，6]。目前，Tang et al.[7]提出了基于秩-1矩阵分解的鲁棒初始化。该方法生成的初始地图没有模型选择问题。此外，该方法通过同时优化所有涉及的相机和点来保证线性时间的快速收敛然而，为了操作矩阵分解，必须在所有使用帧中跟踪用于矩阵分解的所有特征点为了解决这个问题，Tang et al.使用基于KLT跟踪的系统来跟踪特征点。然而，这种方法高度依赖于KLT跟踪的性能[8]。如[9]中所讨论的，它可能会因照明变化和大基线移动而失败。此外，由于KLT跟踪的性质，丢失的特征很难恢复。因此，基于KLT的SLAM仅利用基于RANSAC的η点算法[25，26，27]进行姿态估计，其不如现有技术的间接SLAM系统[10，11]准确。单目SLAM中的另一个关键问题是定位。对于鲁棒定位，当前方法同时利用线和点特征[12，20]。线是一种与点具有对偶关系的几何基元，因此，尽管表示方法不同，但它产生了与点同样重要的有价值的几何信息。Pumarola等人提出了使用点和线的最新方法[12]。该方法表示具有两个端点的线段，并通过对每个端点进行1122⋯⋯C一我端点。3D线上的重投影误差的所有优化操作尽管直线的端点表示也是一种很好的方法，但由于端点移动，这不能可靠地假设存在位于从3D直线投影的线上的检测到的线段。即使线段的两个端点是初始帧帧间当前帧在投影线上平移，线的内部系数相同，但位置不同。这导致了系统的缺陷因素。本文提出了一种鲁棒的单目间接视觉SLAM初始化和定位方法。对于鲁棒初始化，我们利用秩-1分解。在基于特征的间接方法中，特征几乎在所有帧中都被跟踪，因此为了处理这个问题，我们提出了一种利用计算技巧的几何插值[1，36]。几何插值是基于著名的极线约束，使所有的功能被跟踪的所有帧，并提出了计算技巧的有效计算的基本矩阵的几何插值。为了精确定位，该方法利用Pluécker线表示，它在齐次坐标系中很好地表示了3D线。Pluécker线表示比端点表示具有更少的参数，并且不存在移位情况。因此，这种表示比端点表示在计算上更便宜并且在几何上更鲁棒。尽管Pluécker线表示已在其他SLAM中使用[18-23]，但据我们所知，这是第一种在单目间接SLAM中使用Pluécker线表示的方法。此外，我们采用他们的正交表示，其中最小的参数被保留。在此参数化的基础上，解析计算了姿态优化和线图优化的线的雅可比行列式，并通过解耦线来更新线，而无需任何规范自由度。该方法使线优化具有几何鲁棒性、高效性和快速性。最后，我们建议解决退化的线重建发生从两个视图重建的n-视图重建所提出的初始化验证。本文的组织结构如下。第2节和第3节分别详细介绍了基于因式分解的初始化和使用Plu¨ cker坐标的点线SLAM。然后，我们在几何插值完整跟踪n个特征点（一）n1n13m×3m×（b）第（1）款图1：基于秩1因子分解的初始化概述（a）使用几何插值的数据关联。（b）使用来自（a）的关联数据的秩1因子分解。然而，通过使用其描述符的特征匹配可能不会在所有帧中被跟踪因此，如图1所示，所提出的几何插值获得在所有m个帧中被跟踪的η个特征点（一）.我们将在3.1节中详细说明如何构造矩阵A，以及如何在3.2节中执行几何插值。对于本文中的所有符号，我们使用粗体表示向量，而不考虑和，没有粗体的用于矩阵，斜体用于标量或索引。所有点都在齐次坐标系中，I. e. ， x=（x<$T，1）T∈H3， X=（X<$T，1）T∈H4其中x处的上条表示非齐次坐标。此外，直线和平面基本上都用齐次坐标表示。2.1. 点相机约束分解为了将矩阵同时分解为所有相机姿势和3D设Fi为第i帧，Ci为Fi的摄像机位置，则F0为初始帧，c0为F0在原点的摄像机位置p，k是从F0观察的具有倒数深度d，k 的第k个3D点。由于dk未知，为了简化推导，将dk设为1，并在后面进行推广然后，pk成为从通过归一化F中的相应特征点计算的c0观察到的射线。第4款.第5节评价实验，第6节评价实验。6结束了本文。假设没有噪声，则ci0成为2. 鲁棒初始化图1显示了所提出的基于秩1因子分解的初始化的概要。所提出的初始化方法将来自初始帧的后续m个帧与在所有m个帧中被跟踪的n个特征点相关联，以形成如图1所示的矩阵A。（b）.ci = s0i ti = pk − sik pik，（1）其中s0i和sik是该约束的缩放系数，pik是RT pk，并且平移ti和旋转Ri是ci的相机姿态。摄像机姿态可以通过八点算法[25]或五点算法旋转[26]和两点算法平移[27]计算。D11230i i k ik ik不pT20I 0i ik k k ik ik kika =s tcib = p− s p间接SLAM系统，我们进行几何插值矩阵完成。为了精确估计未匹配特征点的位置，我们利用对极几何来我不是ωik了c0−pik希吉克PK使用已知的相机姿态来估计适当的位置。我们首先演示如何插值的位置，然后显示如何进行几何插值。如图3所示，给定所有摄像机的姿态为初始帧[I| 0]，当前帧[R| t] c和后续图2：点相机约束。i n te r-fram es[R|t]i=1c- 1，其中有一个m a t c h i n g p a i r x 0 xcon然而，噪声总是存在于真实数据中，ci由两个表示的中点近似为：在初始帧和当前帧中，通过使两条极线L0、Lc相交来估计帧间帧中的插值点X1 = L0 × Lc。直线l0向前计算11从初始帧作为l0 = Ei x0，其中Ei是基本的c i（a + b）=（s0i ti + pk − sik pik），（2）0022矩阵构造的相对姿态[R| t] i从初始帧到第i帧间。线lc是向后计算的和s和s可以通过求解简单的从当前帧Ic= Ei x其中，Ei由下式构造：0i ik相对位姿|t]的范围内C c c[R| t]-1矩阵方程为：不[i]（ a − b） = 02×1。（三）ik然后，我们现在重写等式（2），将ti替换为R（ ωik） ∙ pk，其是围绕轴pk ×ti的旋转矩阵，角度为ωik，并且将pik替换为R（ik）pk��，其是围绕轴pk ×pik的旋转矩阵，角度为ik，如下所示：C 1（s） R（ ω）p+ p− s R（（p） =v，（4）2其中Aik = 1/2（ s0 i R（ ωik） pk + pk − sik R（ωik）pk）是已知向量。通过使用逆深度将方程（4）中的pk推广到1/dk< $pk ，我们最终得到方程ci< $1/dk<$vik，并且我们求解我C 从当前帧到第i帧间，frame.在图3中，当进行几何插值时，计算从当前帧到帧间的本质矩阵它需要当前帧的相机姿态的逆矩阵为了避免逆矩阵的计算，我们利用SLAM系统的帧已经被顺序捕获的面部。其思想是预先计算每个帧的一些有价值的信息我们注意到，从当前帧到帧间帧的基本矩阵可以通过在从当前帧到初始帧的向后方向上递增地乘以帧间帧与其下一帧间帧之间的基本矩阵来获得。为此，我们存储Ec和来自先前的相对姿态。Mn框架[R| t] c0=[R| t]-1 [R| t] c及其逆[R| t] c-1arg min∑∑c d −A2，（5）C-1cci=1 mi kdk=1 n i=1 k=1ik 2在每一次。然后，在进行插值操作时，可以像链式法则一样容易地计算从当前帧到帧间的本质矩阵。例如，一个点其中m是使用的后续帧的数量对于矩阵分解，n是在所有m帧中跟踪的关键点的数量，ci dk − A ik2是[7]中建议的重新加权几何误差。我们解决通过秩-1因式分解的等式（5），因为深度具有秩在第i帧中，通过从当前帧的向后处理来插值，使用两个基本矩阵来计算位置，其中一个来自初始帧E i，该初始帧E i由自己的相机姿态[R| t] i，另一个来自当前帧Ei = EiEi+1 Ec 、这是获得一个. 可以通过使用SVD（奇异值分解ci+1I+2c值分解）与Lanczos算法[28]，这是一个适应的功率方法找到一个特征向量对应于最有用的一个特征值。因此，已知矩阵A3m×n被分解为相机位置矩阵C3m×1和深度矩阵D1×n，同时重建所有相机和深度。2.2.用几何插值为了将基于因式分解的初始化应用于如图4所示的预存储的逆矩阵的增量乘法。该方法在后续m帧叠加后，对初始帧和当前帧之间的所有匹配特征点进行插值，并进行矩阵分解。用于矩阵补全的点的离群值通过对称对极距离被拒绝[1]。我们使用3.84基于对称核线距离阈值为95%的Y2分布检验。此外，为了避免特征运动时发生的退化，1124xi = l0 × lcxclc = Ei xcCtiR tcR ti R tC c⋯12XL0e c747S c帧间当前帧fx0 cxRcwt cwK =[0fy cy]，Tcw = [T].（七）[一|0个字符]0 0 10 1图3：几何插值概述。使用初始帧和当前帧中的两个点估计帧间的内插点。然后，3D线的本征矩阵1和外征矩阵2如下：fy0 01 =[0f x0]，（8）−fycx−f xc y fx fyxkxkF 0[I| 0]F0XKXKF0Rcw[tcw]×RcwF2R t1E1F1–1cw=[R]。（九）1R t10 022FRt2E1FE2，E2= E2E303×3 cwR t3R t0E02R t3-1 E2207 3 72个F32 3F3E3，E3= E3* E4然而，Pluucker坐标也有两个量规-FF E4，E4= E4E544 07 57自由本身，所以Pluécker的正交表示6F5–1E5，E5= E5* E6R t6 507 6 7566R t56FE6，E6建议将其参数化为最少四个坐标R t0E0F6607F7参数[29]。图4：几何插值的高效操作。xk是初始帧和当前帧之间匹配的特征点。位于几何插值的核平面上，我们任何Plu？cker坐标都可以用标准正交表示（U，W）∈ SO（ 3） × SO（2）来表示，其中SO（ 3）是李代数的特殊正交群[30]如果内插要素位于从初始帧计算出的对极平面上，则从矩阵补全中拒绝要素如：U = [m∥ m ∥Ddm × d]，（10）m × d和当前帧之间的角度在-5至5度之间。W =1[m d].（十一）− d m3. 基于线的定位在本节中，我们演示了所提出的基于线的定位。我们利用Plu？cker坐标及其正交表示来重建和表示三维直线。我们在3.1节中介绍了这些表示在齐次坐标中的概念，并定义了重投影误差和关于那些表示的成本函数，以优化∥ m ∥∥ d ∥U和W可以分别更新为U <$UR（ R），其中R ∈ R3，W <$WR（R），其中R∈ R3，旋转矩阵R（ R）由指数映射表示。因此，我们认为，其中，k=[ kT，k]∈ k4是更新标准正交表示的四个最小参数Pluécker坐标可以是回收从正交表示作为LT~（w11uT，w21uT），其中wij是W中的元素，ui1 2第3.2节系统然后，我们在3.3节中解释解决几种简并情况的线3.1. Plu¨ cker&正交表示用Plu¨ cker坐标表示的三维直线由两个三维点X1~（XT）组成|r1）T和X2~（X<$T|r2）T根据是U的第i列。采用正交表示法在线优化重投影误差3.2. 点-线位姿图优化现在，我们定义线和姿态的1 2[34]中的方式，如以下等式（6）：图优化设Lw是三维空间中的Pluécker在摄像机坐标中的线L_c和在图像空间中的线L_cL = [d] ∈ N中国，（6）其中d=r1X2−r2X1是方向向量，且ndm=d×预测LcMc得到如下：3X_1是该直线的任意一个独立向量。在[1]中描述的Pluécker坐标表示直线，5天。O. f（自由度）在齐次坐标满足克莱因二次约束mT d = 0。此外，Plu？cker坐标还可以在Lc= [dc] =<$cwLw，lc=1mc ∈ <$.（十二）然后，我们将lc与从观察到的线段z测量的两个端点xs、xe之间的正交距离定义为：齐次坐标当K是摄像机固有参数时矩阵与平方像素，和Tcw是外在矩阵为d（ z，lc）=[TxTl，]、（十三）三维点为：l2+l21 2 1 2初始帧x0的⋯l0 = Ei x0 0RR tiEi=t R0 i ×我⋯⋯⋯不1125F1基克杰2其中d（∙）是距离函数。相机姿态Tkw、3D点位置Xwi和3D线的位置Lwj被表示为图模型在图模型中，Tkw的顶点连接每个对于相机姿态更新，相机坐标中的相机姿态的雅可比矩阵由下式给出：Lc−[Rm]×−[[t]×Rd]×−[Rd]×XWI和Lwj作为两种类型的边。然后，重新投影∂✿Ç=[−[ Rd]×03×3]6×6，（20）边缘中的误差如下：Epki=xki−π（KTkwXwi），Elkj=d（zkj，lkj），（14）其中Epki和Elkj指示针对以下的重新投影误差：其中，相机姿态表示相机姿态的参数。等式（20）由Zuo等人在[20]中导出。最后，给出了重投影误差的完全雅可比矩阵，线对线和相机姿态分别如下：分别为点和线，xki是阿吉耶尔联系我们对应于图像中的3D点Xwi的特征点，π（ ∙）J =l=lcw，（21）表示非齐次2D点除以齐次坐标中的最后一个元素，并且lkj = 1mkj，其中L=[m Td T]T =L.∂✿ϴ ∂l ∂Lc ∂Lw ∂✿ϴJ =e l=e l l L c.（二十二）Ç∂✿Ç ∂l ∂Lc ∂✿Ç公司简介因此，用于点-线和姿态图优化的成本函数C被构造为：C =Σ ρ（Ep T p所有关于线路的优化都是通过迭代方法中解析计算的雅可比矩阵进行的。3.3. 线路改造k我基基k、jKJ KJ利用双视图进行三维直线的重建其中ρ（ρ）是鲁棒Huber代价函数，ρ p通过以下步骤。给定两个摄像机投影矩阵P，P其中P = KT ∈3×4，和匹配每一行是点和线的信息矩阵作为它们的逆12i i协方差矩阵为了根据线重投影误差获得雅可比矩阵以优化成本函数C作为迭代方法，我们计算线参数每个摄像机图像中的分段z 1，z 2，其中z包括两个端点{x s，x e}。构造两个平面X1，X2为：1= 1T P1，1 2和相机姿势。我们跳过了关于点的推导，因为它是众所周知的直线的雅可比行列式可以用链式法则解析计算，使推导简单其中l = xs × xe。我们可以构造对偶Plu¨ cker矩阵[1]L* =T −T ∈4×4。因为双Pluuckerw122 1在推导之后。第一，重导数线el= d（z，l）相对于线l的投影由下式给出：基质具有这些性质，∗[d]×ml1 xs ll2 xs lL =【日T0]、（24）Fs−��ys − 11−m埃莱湖1Il2+l2l2+l2I=11 212I. （十六）我们可以直接求出Pluécker坐标（mT，dT）T。ll1 xe ll2 xe l1 2Ie−l2+l2��ye−l2+l21我然而，在这方面，使用两个帧的重建具有L121 2ے2×3在[1]中讨论的被测线位于核平面上时的简并此外，它会错误地创建3D线然后，求出l对Lc的偏导数由Lw表示如下：当线失配时，因为等式（23）和等式（24）无条件地生成3D线，无论匹配是否正确，如图5（a）所示。尔LcLc=1mc=[10Lc∂ℋcw Lw3×3]3×6 、（十七）我们使用n-views三维线重建来解决这些问题。要通过n个视图重建3D线，所有平面lT Pi，（i = 1 <$n）堆叠在矩阵G上：Lw=公司简介=cw.（18）ilT P11我们使用标准正交表示来更新最小L参数，所以我们直接将L的雅可比矩阵写成G=IITP2I.（二十五）wwI I1126LlP关于[29]中提出的建议：Lw=[03×1−w 11u 3w 11u 2∂✿ϴw12u 30 3×1−w 12u 1−w12u1w11u 26×4. （十九）不n nn×4通过G的奇异值分解为[S，D，V] = SVD（G），我们得到两个优势平面<$1，<$2]1127伊什lslLez勒切(a)（b）第（1）款图5：线重建的图示。(a)甚至错误匹配也会生成3D线的线退化情况。右框蓝色线段为右线对，红色线段为错配线。(b)三维直线端点的恢复。可以发现3D线的端点与由垂直于投影线l的垂直线l_n构造的每个p-线相交，投影线l通过检测到的线段z的每个端点。对应于两个最大奇异值的V的列。然后，可以通过等式（23）和等式（24）以相同的方式重建3D线。重建三维直线后，需要恢复两个三维端点进行可视化。由于从线的3D端点投影的测量端点与观察线段的端点相似，因此我们使用[18]中建议的使用相交平面的方式，而不是由于噪声而直接反向投影观察端点，如图5（b）所示。给定观察到的线段z = {xs，xe}和估计的线l，在起始点的情况下，我们通过计算与垂直于l的线l s的交点来计算xs到l的最近点xs，如下所示：=−（y − l2�� + l3）l1l2 、（二十六）ssl1sl2l2+l2对于n视图重建，我们选择三个视图（初始帧，中间帧和当前帧）进行初始化。对于局部映射，从当前关键帧选择三个最接近的关键帧。如果由三视图生成的3D线不满足i）Klein二次曲面约束mTd0.01或ii）投影线与对应线段的端点之间的垂直距离在任何视图中小于1，如果一条线不能生成，则尝试使用中建议的关于每个端点的点特征重构标准通过两视图重构来生成线。[10]以防止端点移位。所有直线的重投影误差都是由垂直距离计算的，也应该小于1。4. 实现细节我们实现了建议的系统与英特尔酷睿i7- 7700 HQ（2.80GHz），8 GB的内存和代码编写的C++。所提出的初始化和基于线的SLAM用于所提出的点-线SLAM系统。该系统构建在ORB-SLAM [10]之上，并且我们基于g2 o [31]姿势图优化框架实现线路优化。因此，系统架构与ORB-SLAM相同，除了i）线特征与ORB点特征同时利用，以及ii）通过所提出的矩阵分解进行初始化。我们使用LSD线段检测器[32]来检测线段，使用LBD线二进制描述符[33]来描述线段作为特征。通过旋转矩阵的8点算法和2点算法[27]翻译矩阵我们只使用鲁棒帧的初始化通过检查内点的RANSAC计划。对于线匹配，如果满足以下条件，则我们拒绝线匹配对：ys = −1s −��L23 .第三章。（二十七）L2线距离除以最大线距离小于0.8，以检查距离相似性。另外，如果线对之间的角度差大于线对之间的计算与x=0相交的x0s，并位于ls上，如下所示：L旋转轴的对应两帧的旋转矩阵��0s= 0，y0s = ys−我们可以计算3D平面，2秒。（二十八）L15. 实验我们将所提出的系统与TUM RGB-D Benchmark[35]中的其他最先进的系统进行了为了S= PT lcs，其中lcs = xS × x0s。（二十九）给定Pluücker线坐标L =（ mT，dT）T，我们可以构造Pluücker矩阵L，三维起始端点Ds可以恢复为：Ds = Ls，其中L =[[m]×d]，（30）−dT 0并且对于终点也进行该过程。为了测量关于所提出的初始化和线表示的精确效果，我们分别对每个部分进行实验。对于与其他初始化的比较，我们比较了建议的初始化和传统的初始化。常规初始化使用ORB-SLAM [10]中建议的方法，其选择用于姿态估计的基本矩阵或单应性的模型，并且使用估计的姿态来重建地标。这两个系统都建立在ORB-SLAM之上。对于线表示的比较，我们调用1128RIPPL-SLAM（Robust Sludge andPluécker Based Pointand Line SLAM）。我们将RIPPL-SLAM与[12]中提出的EPL-SLAM（基于端点表示的点和线SLAM）以及[20] 中提出的 PPL-SLAM （基于 Pluécker 的点和线SLAM）进行了EPL-SLAM采用端点表示三维直线，PPL-SLAM采用Pluücker坐标表示不同雅可比矩阵的三维直线。EPL-SLAM和PPL-SLAM是在常规初始化上提出的，并且被重新实现。PPL- SLAM最初是针对立体声系统提出的，因此被修改为单目系统.对于用于实验的度量，使用由 TUM RGB-DBenchmark提供的ATE（绝对轨迹误差）和RPE（相对位姿误差）。因为单目SLAM上的地图是按比例生成的，所以在对准比例之后，我们评估两个轨迹，地面实况和估计的一个。所有的实验都进行了没有闭环测量精确的影响，不同的定位方法。注意，我们使用每帧2000个特征点来测试初始化，这基本上是建议的特征数量，并且我们不报告GSLAM，因为KLT跟踪在大多数序列中丢失。在不同初始化下测试的实验结果如表1所示结果表明，该初始化方法优于传统的初始化方法。此外，我们强调，所提出的初始化生成一个一致的和准确的地图反复。由于该方法消耗了多帧数据，减少了随机性的影响。相比之下，传统的初始化仅使用两帧，因此生成的地图经常受到随机噪声的影响。图6示出了定位和映射的示例。即使闭环模块被停用，使用所提出的初始化的SLAM然而，传统的初始化有时不能满足相同的位置。此外，图7示出了所提出的初始化生成比传统初始化更快收敛的初始映射。特别地，所提出的方法也是鲁棒的场景，包括低视差的情况下，平面场景，或向前运动，其中传统的方法有弱点，由于模糊。图8显示了对初始化方法的评估w.r.t.不同数量的特征或帧。我们仅使用前100个帧来操作SLAM以仅分析初始地图。为此，我们仅利用RPE度量，并且如果直到100帧才生成初始映射，则我们将错误设置为1图8（a）示出了TUM数据集的具有收敛帧号的平均RPE。随着m的增加，收敛速度减慢，但精度增加。使用m=3是最准确的。然而，无论m如何，所提出的方法优于常规方法。图8（b）示出了根据本发明的实施例的性能表1：不同初始化方法不闭环的实验。该表显示了使用2000个特征点的绝对轨迹RMSE [cm]和相对位姿误差[cm]的定位精度。TUM RGB-D序列建议ini。常规ini。吃RPE吃RPEf1_xyz1.01781.62751.25141.7320f2_xyz0.30621.51350.36551.5413f1_floor3.49384.77563.40034.7493f2_desk4.64646.72414.69427.2342f3_long_office2.97924.15293.07704.1896f3_nstr_tex_far3.68367.8440歧义歧义f3_sit_static0.59340.94570.37830.7105f3_str_tex_far0.87011.54260.77371.3942(a)（b）第（1）款图6：生成的映射的比较。(a)使用建议的初始化。(b)使用传统的初始化。黑点表示系统启动时生成的地标，红点表示重新访问位置时生成的地标。图7：不同初始化的结果。左列表示使用建议的初始化，右列表示传统初始化的失败情况。第一行的数据集是f1_floor，第二行是针对低视差情况通过缓慢和向前运动拍摄的另一个视频。检测到的特征点的数量。我们利用m=3的方法与离群值拒绝和没有分析的本质矩阵的准确性的影响在传统的初始化中，由于严格的标准，特征越少，性能越低。相比之下，所提出的方法是好的，即使在较低的功能，因为这种方法没有严格的标准，和因式分解是容忍较少的功能。此外，所提出的方法利用离群拒绝比没有。这是因为许多内点影响准确的估计。在对线表示的测试中，表2显示了1129表2：不闭环的不同线表示的实验。该表显示了使用500个特征点和300条特征线的绝对轨迹RMSE [cm]的定位精度(a)（b）第（1）款图8.不同初始化方法的比较(a) 平均RPE和收敛帧数目的比较。(b) 不同数量的提取特征的比较。所提出的点-线SLAM系统和现有技术的点-线SLAM系统之间的比较结果。该测试通过仅使用500个特征点和300条线而不是使用每帧2000个点来如表2所示，所提出的方法显示出更好的性能。特别是，如图9所示，所提出的方法即使在平面场景中也能执行精确定位，而其他方法则失败了。此外，委员会认为，重建的3D线条是非常清晰和鲁棒的，因为这些线条是通过测量多视图一致性来生成的（一）（b）第（1）款和鲁棒的标准，以防止端点移动。如图10和图11所示，所提出的方法重建了非常清晰和鲁棒的3D线形状。相比之下，其他方法由于错误匹配的线对的端点移位或退化而生成大量不准确的线。鲁棒清晰的3D线条使得系统的定位更加准确。所提出的系统的执行时间类似于[12]中报道的EPL-SLAM。然而，局部BA比EPL-SLAM快约1.5倍，因为它仅优化了线路的四个参数，而EPL-SLAM使用两个端点优化了六个参数。因此，使用Plu¨ cker坐标更高效，速度也更快。几何插值花费m × 1ms，其中m是用于矩阵分解的后续帧，并且矩阵分解在近0.6ms处完成。因此，所提出的系统可以作为实时系统执行。6. 结论本文提出了一个详细的单目间接SLAM使用建议的初始化和线功能。所提出的初始化利用矩阵分解，这是适用于间接SLAM的建议的插值方法与计算技巧。此外，本文还利用Plu？cker直线坐标及其正交表示计算直线的解析导数。实验表明，该初始化方法在复杂场景中生成的初始地图具有快速和鲁棒的收敛性。一个准确的初始地图也影响更准确的定位，而且，所提出的线表示提高了定位的准确性，减少了计算和存储成本。我们认为图9：f3_nstr_tex_far上的结果。图像（a）表示图像（b）表示EPL-SLAM和PPL-SLAM。(a)一个形象。（c）EPL-SLAM（d）PPL-SLAM图10：每种方法上重建的3D线的清晰度。(a)图像（b）RIPPL-SLAM（c）EPL-SLAM（d）PPL-SLAM图11：每种方法重建的3D线的鲁棒性。图像（a）中的圆化红框的区域用于分析红框中的每种方法上由3D线重建的形状。第一行图像在正视图上拍摄，并且第二行图像在俯视图上拍摄。所提出的初始化和定位方法可用于无特征环境，特别是室内场景。我们将增强离群值拒绝和速度，以实现更准确和快速的初始化和定位。确认本研究由韩国教育部资助的韩国国家研究基金会（NRF）的基础科学研究计划支持（编号：2005）。2016R1D1A3B03934808）。TUM RGB-D序列RIPPL-SLAM（拟议）EPL-SLAMPPL-SLAMf1_xyz0.93991.18731.0816f2_xyz0.39070.35970.3436f1_floor3.49883.33784.7881f2_desk5.53715.36537.0389f3_long_office1.55301.8460歧义f3_nstr_tex_far1.5060歧义歧义f3_str_tex_far1.00591.02941.05181130引用[1]Richard Hartley和Andrew Zisserman，计算机视觉中的多视图几何，第2版。剑桥大学出版社，2004年。[2]菲利普·H乇几何运动分割和模型选择。伦敦皇家学会哲学汇刊A辑：数学、物理和工程科学，356（1740）：1321-1340，1998年。[3]克里斯托弗·H Longuet-Higgins从两个透视投影重建平面，伦敦皇家学会会刊。B 系列。生物科学， 227（1249）：399 -410，1986年。[4]Jakob Engel ， et al. LSD-SLAM ：大规模直接单眼SLAM。在ECCV的Proc.，834-849，2014中。[5]Jakob Engel，et al.直接稀疏测距法。IEEE transactionson pattern analysis and machine intelligence，40（3）：611-625，2018。[6]Paul Bergmann等人用于实时视觉里程计和SLAM的自动曝光视频的在线光度校准。 IEEE Robotics andAutomation Letters，3（2）：627-634，2018。[7]Chengzhou Tang，et al. Gslam：通过全局运动恢复结构的初始化鲁棒单目视觉slam。2017年3D视觉国际会议（3DV）IEEE，155-164，2017。[8]Carlo Tomasi和T.卡纳德点特征的检测与跟踪。卡内基梅隆大学技术报告CMU-CS-91-132，1991年4月。[9]西蒙·贝克和伊恩·马修斯。卢卡斯-卡纳德20年来：统一的框架。国际计算机Vision，56（3）：221- 255，2004.[10] Raul Mur-Artal，et al. Orb-SLAM：一个多功能和精确的单目SLAM系统。IEEE Trans. Rob.，31（5）：1147[11] Raul Mur-Artal和Jaun D.塔多斯Orb-slam 2：一个用于单眼、立体和 rgb-d 相机的开源 slam 系统。 IEEETransactions on Robotics，33（5）：1255-1262，2017。[12] Albert Pumarola等人PL-SLAM：具有点和线的实时单目视觉SLAM。2017年IEEE机器人与自动化国际会议（ICRA）IEEE，4503-4508，2017。[13] Georges Younes等人，.基于关键帧的单眼SLAM：设计、调查和未来方向。机器人和自主系统，98，67-88，2017。[14] Georg Klein 和 David Murray ， “Parallel tracking andmapping for small AR workspaces”，[15] Christian Forster等SVO：快速半直接单眼视觉里程计。2014年IEEE机器人与自动化国际会议（ICRA）IEEE，15-22，2014。[16] Nianjuan Jiang，等.一种全局线性的摄像机位姿配准方法In Proc. of ICCV，481-488，2013.[17] 崔兆鹏和谭平。通过相似性平均的全局运动恢复结构。In Proc. of ICCV，864-872，2015.[18] Guoxuan Zhang，et al. Building a 3-d line-based map usingstereo slam，IEEE Transactions on Robotics，31（6）：1364 - 1377，2015。[19] 颜璐和宋德贞。Robust rgb-d odometry using point andline features ， in Proceedings of the IEEE InternationalConference on Computer Vision，3934[20] Xingxing Zuo ， et al. 具有点和线特征的鲁棒视觉SLAM2017 IEEE/RSJ英特尔智能机器人与系统国际会议（IROS）。IEEE，1775-1782，2017。[21] 托马斯·勒梅尔和西蒙·拉克鲁瓦。基于单目视觉的线段SLAM2007年IEEE机器人与自动化国际会议论文集，2791- 2796，2007。[22] Joan Sola等单目SLAM中线段的无延迟初始化。2009年IEEE/RSJ 智能机器人和系统国际会议 1553-1558 ，2009。[23] 董瑞芳等基于线的单目图SLAM。2017年IEEE智能系统多传感器融合与集成国际会议（MFI），494-500，2017。[24] Lilian Zhang和Reinhard Koch。来自线对应的结构和运动：表示、投影、初始化和稀疏束平差，视觉通信和图像表示杂志，25（5）：904 -915，2014。[25] Wojciech Chojnacki和Michael J.布鲁克斯哈特利的规范化八点算法。 IEEE 模式分析与机器智能学报， 25（9）：1172- 1177，2003.[26] Luarent Kneip等人独立于平移，找到两个图像之间的精确旋转。在ECCV的Proc.，696-709，2012中。[27] Luarent Kneip和Rolend Y.西格沃特用一个摄像头和一个imu实现鲁棒的实时视觉里程计。在Proc. BMVC，16.1[28] 李文，解线性微分和积分算子特征值问题的一种迭代方法，李文，李文. Res. Nat'l Bur. STD. 45，255-282，1950.[29] 阿德里安·巴托利和彼得·斯特姆使用线的运动恢复结构：表示法、三角测量和光束法平差。计算机视觉与图像理解，100（3）：416-441，2005.[30] 大厅 B. C. 李群、李代数和表示： An ElementaryIntroduction，Graduate Texts in Mathematics，222（2nded.），Springer，ISBN 978-3319134666，2015。[31] Rainer Kuemmerle 等人 g2o ： A general framework forgraph optimization，in IEEE International Conference onRobotics and Automation（ICRA），Shanghai，China，May 2011，3607 -36

下载后可阅读完整内容，剩余1页未读，立即下载