没有合适的资源?快使用搜索试试~ 我知道了~
可在www.sciencedirect.com在线获取ScienceDirectCAAITransactions on Intelligence Technology 1(2016)90e103http://www.journals.elsevier.com/caai-transactions-on-intelligence-technology/原创文章低动态工作空间环境下多会话RGBD SLAM框架王跃a,黄守东b,熊荣a,*,吴俊a浙江大学工业控制与技术国家重点实验室b澳大利亚悉尼科技大学工程与信息技术学院自主系统中心2016年6月4日在线发布摘要由于工作空间的不可避免的变化,在动态环境中的映射是自主移动机器人的一项重要任务在本文中,我们提出了一个框架,RGBD SLAM在低动态环境中,它可以保持一个地图保持跟踪的最新环境。描述环境的主要模型是一个多会话姿态图,它在机器人的多次访问中演变。当对应于这些姿势的3D点扫描过时时,图中的姿势将被修剪。当机器人探索新的区域时,它的姿势将被添加到图形中因此,保存在当前图中的扫描将始终提供最新环境的地图过期扫描识别模块通过对不同会话中采集的扫描数据进行分析,检测出环境的变化此外,冗余扫描识别模块被用来进一步减少与冗余扫描的姿态,以保持相对于环境的大小的图形中的姿态的总数。在实验中,该框架首先进行了调整和测试的Kinect从实验室环境中获取的数据。然后将该框架应用于Kinect II从另一个国家的工业机器人工作空间获取的外部数据集,以进一步验证性能。经过这两步评估,建议的框架被认为是能够在动态或静态环境中管理地图的日期与非累积的复杂性和可接受的错误水平。Copyright© 2016 , 重 庆 理 工 大 学 . Elsevier B. V. 制 作 和 托 管 这 是 CC BY-NC-ND 许 可 证 下 的 开 放 获 取 文 章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。关键词:多会话SLAM; RGBD传感器;低动态映射1. 介绍同时定位与地图构建(SLAM)是实现机器人自主性的核心技术,如机器人小车[1]和自主水下航行器[2]。相对于这些高成本和大型设备,中小型设备,如移动机械手,飞行机器人和手持设备,近年来开始引起人们的关注,由于高灵活性,低成本,从而具有很好的应用前景。这些设备也要求SLAM实现长期运行的能力。这类问题的主要挑战是*通讯作者。浙江大学工业控制与技术国家重点实验室,浙江省杭州市西湖区浙大路38号,邮编:310027。电子邮件地址:rxiong@iipc.zju.edu.cn(R. Xiong)。重庆理工大学负责同行评议解决方案包括三个方面:(1)由于自由环境的影响,飞行机器人和手持设备的运动模式具有更频繁的方向变化。(2)这些装置的目标是低成本、重量轻和小规模,因此不能装备昂贵或沉重的传感器;(3)这些设备通常周期性地工作在具有低动态的预定义的人类可共享工作空间中,这意味着工作空间中的对象可能被移动,在多个会话中添加或删除。消费级RGBD传感器使得以低成本收集强度和深度信息变得非常方便。对于前两个挑战,我们应用RGBD传感器进行感知,从而实现3D姿态估计,同时也为后续导航提供密集的环境地图。第三个挑战是处理跨多个会话的对象更改(移动、添加、删除)。一个快速的解决方案是建立http://dx.doi.org/10.1016/j.trit.2016.03.0092468-2322/Copyright© 2016,重庆理工大学由爱思唯尔公司制作和主持这是一篇基于CC BY-NC- ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。Y. Wang等人/CAAI Transactions on Intelligence Technology 1(2016)90e 10391地图在每一届会议,但这种方法丢弃所有的历史经验。我们的解决方案是管理地图中的动态。具体地,多会话SLAM组件被用于累积地图构建。在此基础上,提出了一个地图管理组件,以保持地图的紧凑性和跟踪环境的变化。有了这个框架,我们就能够应对所有三个挑战。在以前的研究中,已经提出了各种SLAM方法来映射这种传感器的环境。现有的RGBD映射方法主要针对单会话和相对静态的环境或具有高动态的环境[3e5]。然而,多届会议情景中出现的低动态并未引起太多关注。提出了一些方法[6e8]来应对这一挑战。他们使用视觉或平面激光传感器,其捕获有限的动态,并且不能简单地扩展到使用RGBD传感器。使用视觉传感器的方法可以判断帧是否具有明显的外观变化,因为它是基于特征的。由于RGBD传感器还提供深度信息,因此我们可以捕获几何变化,并确切地知道帧中发生了什么变化。激光传感器的方法通常采用二维网格占有图作为地图表示,由于三维网格的高度复杂性,这在RGBD SLAM系统中是不适用的。此外,在2D中捕获的动态只是3D动态的一部分,这可能在语义上是不够的。据我们所知,我们的系统可能是第一个在6 DoF多会话SLAM的场景中仅使用RGBD传感器在低动态环境上构建地图的系统。我们提出了一个框架,可以建立地图跟踪当前的环境,防止在以前的会议纳入环境的变化。图1给出了在考虑和不考虑办公室环境中的工作空间中的低动态性的情况下由多会话SLAM系统生成的最终地图之间的比较。对象(书籍、罐头、盒子等)在会话中被添加、删除和移动。在10次SLAM会话之后,未考虑低动态的SLAM将当前和过时的信息混合在一起,导致具有不正确的重复对象的无用地图,而所提出的系统考虑低动态,在地图中展示当前环境。本文的主要贡献包括:提出了一种低动态环境下的多会话RGBD SLAM框架,该框架由多会话SLAM和图管理两部分组成。多会话SLAM组件具有图形模型,其中每个节点是姿态并且每个边是约束,因此融合来自先前会话和当前会话的信息以将地图保持在一个全局坐标中。图管理组件通过使用过时扫描识别模块和冗余扫描识别模块来保持图模型的实时性和非累积复杂度提出了一种过时的扫描识别模块,用于在机器人上使用RGBD扫描来查找先前的位姿在当前会话中更改的环境。这个模块的目的可以通过设置一个例子来解释,一个杯子在以前的课程中放在桌子上,但在当前课程中被移除。然后,观察桌子上杯子的姿势应该被发现并修剪,以保持地图跟踪环境变化。由于网格占用模型的不适用性,我们的思想是采用摄像机投影模型和连通分量检测来发现前一次扫描生成的地图与当前扫描生成的地图之间的差异。该方法保留的位姿始终是实时扫描的,对噪声和RGBD传感器中出现的孔洞具有鲁棒性。提出了一种冗余扫描识别模块,用于发现RGBD扫描与其他扫描有较大重叠部分的位姿。该模块用于在更新扫描的数量高于预定义阈值的情况下减少姿态的数量,这使得SLAM的计算时间与地图的大小和一个会话SLAM而不是所有会话SLAM相关。我们的方法的想法是找到一个子集的姿态,可以生成一个地图类似于原来的一个使用所有的姿态,在Kullback的 Leibler分歧的措施。通过应用该方法,当机器人在低动态环境中在固定大小的静态区域中执行多会话SLAM时,计算复杂度将保持恒定,因为具有冗余扫描的位姿已经被修剪,尽管它们是最新的。为了展示该框架的性能,我们在办公室环境中的工作空间上的2个会话和10个会话数据集中调整和测试该算法,其中多个对象在会话中移动,添加和删除,这些对象由手持Kinect传感器收集。图1中的结果验证了所提出的方法的有效性。在此之后,该框架被应用于在工业机器人的工作空间中捕获的5个会话的外部数据集上,该外部数据集具有跨会话操纵的各种大小的框,这对开发阶段是盲目的,用于评估实际性能。论文的其余部分组织如下:在第2节中,将讨论映射动态环境和姿态修剪的相关工作。在第三节中,介绍了在低动态环境下的多会话RGBDSLAM的建议框架。在第4节和第5节中,将详细介绍拟定的过期扫描识别和冗余扫描识别。在第6节中,我们将使用真实世界的数据集演示实验结果。结论和未来的工作将在第7节中讨论。2. 相关作品静态环境中的多会话SLAM首先在基于视觉的方法中提出[1,6,9]。这些工作阐述了基本概念,即机器人不能简 单 地开 始 一 个 新 的映 射 会 话 ,而 不 使 用 的信 息 在considerious会话,因为在过去的会话中的约束提供●●●92Y. Wang等人/CAAI Transactions on Intelligence Technology 1(2016)90e 103Fig. 1.点云中的重建的低动态环境与使用多会话SLAM的10个会话映射的比较,而不考虑低动态(顶部)和考虑低动态(底部)的所提出的框架人们可以看到,书,盒子,瓶子和塑料袋是重复的,使现场与不正确的重复信息。书和芯片可以突出使用光明和黑暗的橙色矩形。他们过时的位置用红色矩形突出显示。箭头显示了对应关系。用于更好的姿态配置估计的信息。因此,在这些工作中,锚节点[9],弱链接[1,6]被引入来解决问题。研究了低动态环境下基于视觉的SLAM方法见参考文件[10],多个姿势形成了一个视图集群,其中具有相似视图的图像将随着时间的推移而更新。该方法可以判断帧是否过时,但不能显示哪个部分已经改变,因为它是一种基于稀疏视觉特征的方法。现有的动态环境下的SLAM方法大多是基于二维激光SLAM的。在参考文献中。[11,12],通过在每个新会话后采样来更新全局坐标中的扫描集,以构建更新的地图。在他们的工作中,在第一届会议上由SLAM估计姿势。对于后面的会话,通过定位来估计姿态,而不包括在SLAM框架中。在参考文献中。[8,13],这两项工作都描述了网格占用图中每个单元的动态,具有独立的马尔可夫模型。在参考文献[7]中,动态环境地图被建模为姿态图。在每次会话之后,基于从激光数据构建的2D占用网格图来识别和移除过时的姿势。在参考文献[14]中,删除了与低动态相关的姿态,以增强优化器的鲁棒性在RGBD SLAM的上下文中,大多数作品应用图模型,然后是全局优化后端。在参考文献[15]中,采用视觉特征和深度信息来形成姿态图中的边缘。除此之外,文献[3]还提出了一种环境测量模型用于姿态图的边缘选择.在参考文献[4]中,使用密集视觉里程计作为前端来制定姿势图,这比基于稀疏特征的视觉里程计更准确。在文献[5]中,非刚性变形与全局一致稠密地图的姿态图优化相结合,考虑了地图网格。这些RGBD SLAM系统的扩展到多会话可以通过应用在参考文献中开发的方法来实现。[1,6,9]。但单纯的基于激光的方法很难检测到动态,因为该方法采用占位网格图进行信息融合和去噪。当涉及RGBD传感器的情况时,由于高复杂度,3D遮挡网格地图是难以处理的。因此,应该在原始传感器数据上开发方法,使问题更具挑战性。RGBD SLAM框架除了需要动态环境处理机制外,还需要节点剪枝来保持计算复杂度的非累积性。Y. Wang等人/CAAI Transactions on Intelligence Technology 1(2016)90e 10393B-xt; cbB图修剪的目的是将节点的数量与映射区域的大小而不是轨迹联系起来。在参考文献[16]中,提出了一种简化的姿态图,用于在发生循环闭合时通过合并边缘来映射大规模多会话数据集。但是这种方法不能将图的大小控制为预定义的数量。在参考文献[17]的2D激光测绘和我们最近的工作参考文献[17]中,[18,19]在特征映射上,这些方法来自传感器读数的信息增益。因此,图形的大小可以根据用户的需要进行控制。从框架的角度出发,需要设计一种与其他模块兼容的可控制节点剪枝方法。与所提出的框架最相似的研究之一是[7],其中研究了低动态环境中的多会话2D激光SLAM。他们的方法在几个方面与我们的工作不同:首先,我们使用RGBD传感器,这使得过时的扫描识别更加困难。因此,可以捕获完整的动态对象,而在2D地图中几乎不可能。第二,我们应用冗余扫描识别,以保持地图映射,其中每个节点是姿态,并且边缘是约束,这是由传感器数据对齐分配的两个姿态之间的姿态变换。传统的SLAM系统是通过对图形进行优化来获得配置的最适合所有约束的节点,这些约束是估计的姿势。多会话SLAM组件将进一步调查跨会话的传感器数据对齐,使得新会话可以被添加到由先前会话构建的图中,从而将隔离的信息利用到用于映射构建的通用表示中。具体地,多会话SLAM组件中的前端将基于RGBD传感器数据来估计会话内和会话间环路约束。后端是执行姿势图优化。姿态图被定义为_状态向量x及其对应的信息矩阵U。状态向量中的每个状态都是一个姿势。我们有以下符号:● 将会话t-1处的最终姿态图表示为Xt-1;p,并且与映射区域有关,而不是映射会话的大小,这将导致复杂性非累积。_t1;pUK的姿势。 这些姿势都是现成的。当在第一会话中时,该图为空,K为1/4。第三,在每个会话中的初始姿势不需要是已知的。将会话t处的初始图表示为xt;c_t;c和U与N我们的框架。另一个类似的工作是[20],他们的工作可以描述房间内动力学的演变,但●姿态,其中N>K。 第一个Kst batesb1:K是正确的-他们的系统定位依赖于2D激光,而我们的系统完全依赖于RGBD传感器。因此,他们的方法不是在3D SLAM的背景下开发的,因此不能被响应于具有Xt-1;p中的状态的相同姿势,而最后NeK个姿势被添加到会话t。●表示在会话t连接姿态i和姿态j应用于手持或飞行场景。作为xt_t和联合bij ij3. 框架该系统由多会话SLAM组件和图形管理组件组成。前者包括SLAM前端和后端,这将在本节中介绍,而后者,过时和冗余扫描识别,以及边缘化,将在后面的章节中介绍。其原理图如图2所示。(2)过时扫描识别模块将识别对应于过去姿势的扫描是否过时,如果是,则节点将被修剪,因为它们不再对地图构建和环路闭合有用;(3)当更新节点数大于阈值时,冗余扫描识别模块将继续进行姿态修剪,该阈值与映射区域的大小有关;(4)将图边缘化,保留节点修剪后的信息,为下一个会话形成完整的约束,遵循文献[21]的方法。当阈值被设置为3时,在会话t处的整个过程的说明性示例在图3地图是通过在当新会话开始时,在找到会话间循环闭合之前,新姿势将被添加到新姿势图中环路闭合检测遵循参考文献[3]中的方法,但在来自先前会话的姿势之间进行。如果检测到的环闭合约束连接到先前会话中的姿势,则找到会话间环闭合然后将两个孤立子图变换到泛坐标系中,并将状态向量和信息矩阵连接起来。通常,姿态图中的孤立子图的数量指示地图的坐标优化将应用于每个子图。在大多数情况下,在会话之后将仅存在一个子图,除非新会话在新的地方进行,从而导致未发现会话间环路闭合。为了估计会话间和会话内约束的姿态变换,我们应用基于特征的对准,然后是密集ICP对准。SURF[22]特征被提取并匹配用于基于RANSAC的3D-2D姿态对准[23]。它被用作ICP的初始值,ICP在系统中是点到面EM衍生版本[24]。在会话t的后端,优化问题被公式化为相应的姿势捕捉它们。因此,xt;c¼argm inX?x t-f.x;x′2t-1;p-x--多会话SLAM组件的目的是估计多会话SLAM组件中使用RGBD传感器数据的多会话的全局一致性度量。 姿态图被用来表示i;j 伊伊我JTUij1:K_t1;pU2BB94Y. Wang等人/CAAI Transactions on Intelligence Technology 1(2016)90e 103BBBB图二.我们的多会话RGBD SLAM在动态环境系统的框架。每当新帧到来时,多会话SLAM组件使用RGBD传感器数据产生地图,其中过时的扫描被识别和修剪,因为它们不再对地图构建和环路闭合有用。然后,冗余扫描识别模块将继续修剪姿态,如果过时的节点的数量高于阈值。最后对图进行边缘化,保留节点修剪后的信息,形成下一次会话的完整约束图3. 一个例子的程序中提出的算法在左图中,蓝色节点和边表示会话t-1时的最终姿态图,大小为3,绿色节点和边是会话t时获得的姿态和约束,整个图是会话t时的初始姿态图。在中间的图表中,红色节点是当黄色节点被识别为冗余节点时,其可以是当前会话或先前会话的姿势,黄色节点被识别为过时节点,其只能是先前会话的姿势在右图中,冗余和过时的节点被边缘化,形成会话t的最终姿态图,也是下一个会话的集成约束,其与会话t-1的最终姿态图具有相同的大小,黑色边缘通过边缘化生成。其中xi是第i个姿态,f是将两个姿态映射到它们的相对姿态变换的函数。在第一会话中,由于第二项为空,因此方程变成标准姿态图SLAM优化问题。在以后的会话中,第二项中的约束由最后会话中的最终姿态图形成。在Xt;c中的姿势的数量是N,其应当在下一会话中减少到K如图2所示,这是通过从xt;c中识别过时和冗余的扫描来实现的。通过将图形管理组件连接到多会话SLAM组件,系统能够以受控的复杂度及时跟踪地图4. 过期扫描识别在本节中,我们提出了一种过时扫描识别方法,该方法可以在3D映射在2D修剪中使用2D占用网格,但在计算上比3D占用网格更有效。在介绍我们的过时扫描识别模块之前,我们首先回顾了基于占用网格图的方法。通过融合网格状态的多个测量值来构建占用网格图,网格状态由扫描中每个像素的光线投射确定。每个网格中有三种状态:占用,自由和未知。通过将通过扫描xtc中的前K个姿态(来自先前会话)生成的占用网格地图中的网格的状态与通过扫描其他Nk个姿态(来自当前会话)生成的地图中的对应网格的状态进行比较,可以检测动态部分。规则很简单,如果一对网格中一个是自由的(被占用),另一个是被占用的(自由),那么这对网格就被标记为环境变化现在我们回到RGBD扫描。首先,将通过对xtc中的前K个姿态的扫描生成的点云放入体积中,Y. Wang等人/CAAI Transactions on Intelligence Technology 1(2016)90e 10395前一卷(PV)通过扫描其他Ne K姿态的方法也是如此,称为当前体积(CV)。两个卷的大小应该相同。然后通过比较PV和CV,我们对网格进行了分类情况1:CV中的网格包含点,而PV中的相应网格不包含点。情况2:CV中的网格不包含点,而PV中的相应网格包含点。情况3:CV中的网格和PV中对应的网格都有点。情况4:CV中的网格和PV中的相应网格都没有点。这里的网格是体积中的体素,包含一个立方体空间。请注意,它与占用网格映射中的不同。它只是一个容器,保存了一系列位于其立方体区域中的端点。因此,不进行光线投射。可以看出,变化必须包含在属于情况1和情况2的网格一种简单的方法是通过简单地使用基于网格占用图的方法中的类似规则来检测变化,即找到属于情况1(情况2)的网格,我们的结果如图1中左上图所示。 四、差的结果是由于缺乏网格占用模型,该模型隐含地解决了以下两个问题:在我们的点云体积中没有未知状态,因此在当前会话(先前会话)期间未观察到的部分被视为等同于占用网格地图中的自由状态。实际上,这样的部分不能被视为动态的,因为在当前会话(先前会话)中没有获取信息。获取的点云质量差,没有网格占有图的融合机制。因此,在我们的方法中,我们显式地采用测量模型来识别哪个部分是过时的或未感测的,其输入是情况1和情况2中的潜在点云的集群,因此可以减少所应用的测量模型的数量,并且对噪声更具鲁棒性。为了更清楚地说明该方法,本文将逐步介绍在网格占用图中,如果网格具有未知状态,则意味着没有波束穿过该网格。如果一个网格是自由的,这意味着有一个光束穿过并穿过该网格。这表明在地图构建期间应用了传感器测量模型。在网格占用图中,当新的扫描被注册到图中时,使用光线投射隐式地应用该模型。受此启发,摄像机投影模型被显式地应用于网格中属于情况1和情况2的那些点。测量模型如下,u¼ PRT p- t其中P是摄像机固有矩阵,R和t是姿态,p是点。u的第三个条目u(3)是p从该姿势的深度。同时,我们具有深度图像的像素(u(1)/u(3),u(2)/u(3))中的真实测量d。如果d小于u(3),则该点从该姿态被遮挡,因此不获取信息。如果d大于u(3),则意味着从这个姿势应该观察到点,但实际上没有观察到。唯一的原因是,当在该姿势中进行测量时,该点被移除,这给出了环境变化的线索。该算法显示见图4。使用朴素方法(左上)、算法1(右上)和算法3(下)的检测结果。点云对应于红色的动态部分和黄色的静态部分在右下角,添加的部分为红色,删除的部分为黑色。●●●●●●96Y. Wang等人/CAAI Transactions on Intelligence Technology 1(2016)90e 103其中ε是深度噪声容限的参数。算法1. RGBD传感器测量模型。通过将该模型应用于情况1和情况2中的点,我们得到了图1中右上图所示的结果。 四、结果现在好得多,但也动态地检测到一些像点的噪声这是由于总结的第二个原因在网格占用中map的融合机制,可以有效地降低噪声但在我们的情况下,没有融合机制。此外,Kinect原始数据的质量比激光获取的数据更差,尤其是它有洞。所以我们不能假设网格是独立的[7,8,13]。由于环境的变化通常是在物体的层次上,因此采用连通分量对网格进行聚类在情况1(情况2)中,导致在相同情况下每个簇具有一系列相邻网格的簇,这现在更像对象并且对噪声更鲁棒。识别动态连通分量的算法如算法2所示,其中t0是消除具有少量点的连通分量的阈值,t1是消除几乎没有证据支持其是动态的连通分量的阈值。算法2. 连接的元件标识。该模型的说明如图所示。 五、给定姿势i在先前的会话中和当前会话中的姿势j中,具有黑色边界的点被姿势j看到。注意,点A不能被姿态j看到,因为它的投影在姿态j的视场(FoV)之外。点B和点C在两个姿势中都可以看到。对于点D,它被投影到Posej的FoV中,但它被点B遮挡,因此投影深度将明显大于实际深度值。因此,它是正确的点D,不能看到的姿态j。当到达点E时,来自Posej的光线在这个方向上穿透它,这使得投影深度明显小于实际深度值。这种情况仅在以姿态j进行扫描时不存在点E的情况下发生。因此,我们可以知道点E是动态对象上的点图五、一个扫描分析的例子,以决定一个点是否可以或不能被一个姿势看到。点A无法被“姿势j”看到,因为其投影在“姿势j”的FoV之外。点B和点C在两个姿势中都可以看到。“姿势j”无法看到点D,因为它被点B遮挡点E可以被Posej看到,但实际上没有被看到,因为当Posej获取其观察时,点E不存在。将所有这些放在一起,所提出的过时扫描识别方法在算法3中示出。结果显示在图4的下一行中,其中可以看到检测到的变化是清楚的,并且正确地编码了变化部分。该方法的主要步骤是遍历体中的所有网格,两个连通分量和检测使用测量模型在连通分量的水平。输入到测量模型步骤的点只是所有点的一小部分。如果应用3D占用模型,Y. Wang等人/CAAI Transactions on Intelligence Technology 1(2016)90e 10397z吉吉吉BJ我J计算负担是关于占用体积的形成和占用体积中所有网格的遍历。形成需要时间的光线投射在所有像素(具有相同数量的点)。再说了,光线投射原来的一个在KL分歧。问题陈述如下b¼ argmin ×D。z轴比简单的矩阵乘法更耗时。 这两个jiJ这些因素使我们的方法更有效。我算法3. :过时的扫描识别。5. 冗余扫描识别Di.zjpmZInp. mjZ-zpmijZ冗余扫描识别模块将进一步选择要修剪的姿态,如图2所示。所以这个模块保证了在这个会话中最终图的大小是有界的,因此是实现非累积复杂性的关键因素。该方法是找到一个子集的姿态生成一个地图接近的一个完整的姿态集生成。由于这是一个NP难问题,因此我们使用贪婪策略每次选择一个姿势。在本小节中,我们将介绍一种姿态修剪算法,该算法将生成一个接近其中是使用优化的姿态Xt变换成全局坐标的扫描;c.Z是所有此类全局协调扫描的集合。Zezj是除zj之外的所有扫描的子集。从过时扫描识别模块获得的体积中的第i个网格具有值为1或0的m,以指示网格是否被占用。网格中的每个点都被认为是一个积极的观察,这意味着该网格被占用。因此,背后的想法是找到扫描的子集,生成与原始体积具有相似占用率的体积mi¼0;1此模块的输入是一组已注明日期的扫描。如果如果这种扫描的次数仍然高于阈值,X98Y. Wang等人/CAAI Transactions on Intelligence Technology 1(2016)90e 103BpmP.þþ一JIJP 布JIJP我Pð ¼j我我与基于网格占用映射的方法[17]不同,我们的方法使用仅考虑射束终点的模型,因此在过时扫描识别期间获得的体积可以直接用于该步骤。避免了建立三维占位网格图的光线投射计算量大的问题。在这个模型中,将不会有负面的观察,这给出了一个网格是未被占用的信息。对于第i个网格,第p个正观测值-tions 在 的扫描zj是表示作为福伊普湾 表示a<$po ijpjm <$1和b<$po ijpjm <$0。通过在m i之前设置一个uni形式,我们有p m1ZpZjmi¼pZjmi<$1pZjmi<$0ajjoijp j¼PjojPjoj框架在10个会话数据集上进行验证,以显示性能。在我们的实验室中,使用手持Kinect收集2个会话和10个会话的数据集,因此这一步是分割数据集测试。第三,为了进一步测试性能,我们从另一个国家使用Kinect II的工业机器人的工作空间中收集了另一个5会话数据集,这对我们的算法开发是完全盲目的。该外部数据集预计将显示拟议框架的真实性能。所选参数见表1。实验室是一个典型的人与机器人共享的工作空间环境,它生成2个会话和10个会话的数据集。实验中的工作空间是服务机器人的实验台,在这个工作空间中,服务机器人和人都可以频繁地添加、移除和移动物体。布置了工业机器人的工作空间就像工厂一样。有各种大小由机器人和人类共同操控地图pZjmi<$0ipZjm<$1pZjm<$0bjjoijp jaPjjoijpjbPjjoijpj表示n ¼ P。我是IJP。,导致如果未更新,则无法告知当前状态,从而使机器人无法执行任务。此外,如果过时的图像或点云提供了过时的线索,则会影响机器人的目标定位和自定位。 如果所提出的映射系统能够识别动态并保持地图跟踪环境,则可以解决这些问题。Di.zj.欧伊普 aNlna bN lnbaNbNlnaN-joijpjbN-joijpjaN6.1. 冗余扫描识别结果冗余位姿识别模块其测量扫描的信息贡献。该测量可以用于找到姿态的子集,从而以最小的信息损失生成地图。通过重复该过程,保留姿势的数量可以等于阈值。这是实现非累积复杂性的框架的关键部分。低动态环境包括作为特殊情况的静态环境。当机器人在固定大小的静态环境中执行多会话SLAM时,机器人始终具有环路闭合。如果不采用额外的修剪技术,图的大小将保持增长,因为所有扫描都在这种环境中没有变化。除了环境动态之外,这个例子还表明,由于连续重访映射的静态区域,即使在 低动态环境。6. 实验结果在本节中,我们使用从现实世界中收集的数据集来演示所提出的算法的性能。有三个步骤来评估框架的性能。通过与其他算法的比较,证明了冗余扫描和过期扫描识别的有效性。在两个算法之上的框架在2会话数据集上进行评估,以说明所提出的框架的过程。参数也在此数据集上进行了调整。其次,在最佳参数下,就是用固定数量的姿势尽可能多地覆盖体积。将修剪前的原始体积视为二进制标记体积,根据体积中的网格是否具有点来分类。然后,由姿势构建的体积有三种情况:情况1:原卷中的网格有点,而对应的一个没有。第二种情况:原始体和修剪体中的网格都有点。情况3:原始体积和修剪体积中的网格都没有点。现在我们可以将覆盖率定义为#case2/ #case1 #case2。我们在2个会话中选择姿势集从我们的10个会议,以显示该方法的比例。为了比较,使用随机修剪方法。结果在表2中示出,其中左侧的列表示最终姿态图的大小,并且RSI指示所提出的姿态图的大小。表1实验中使用的参数参数值意义ε0.05深度差K30最终图形网格大小0.02网格的体积的t025分钟元件中的点数t10.3分钟动态对象中点的百分比J●●●Y. Wang等人/CAAI Transactions on Intelligence Technology 1(2016)90e 10399表2覆盖率比较。粗体表示,最佳性能在相应的配置中。子集/全集RSI随机均值随机标准品10/680.82460.50640.065220/680.93110.71090.048930/680.96690.79560.068540/680.98350.88950.038850/680.99260.92940.025310/560.79310.50280.060820/560.91410.72660.044330/560.97590.81680.054840/560.99370.91590.039650/560.99910.96490.0241冗余扫描识别。可以看出,对于修剪后的姿态数量超过30个,覆盖性能超过95%,这意味着当应用所提出的方法时,使用一半的姿态覆盖几乎整个地图。因此,每个会话的最终姿态图的大小设置为30。6.2. 2-会话结果在这个实验中,两个会话之间的动态包括:一个瓶子和一个杯子被移除,一个盒子被移动,一个坐着的人出现在第二个会话中。在图6中,示出了每个会话中的场景的一瞥。我们可以看到上面提到的差异。过时扫描识别的结果如图4的右下图所示,其中瓶子和马克杯被移除,移动的盒子和新出现的坐着的人被更新。在图7中的左图中示出了由多会话姿态SLAM使用所有信息而没有修剪生成的密集图。人们可以看到,所有的对象出现在桌子上(瓶子,马克杯和两个重复的盒子由黄色圆圈表示)。使用所提出的方法的图7中的右图中的地图跟踪当前环境,如图7中的图。第 六章6.3. 过期扫描识别结果为了评估过时扫描识别的性能,我们在10个会话数据集上将所提出的算法与基于3D占用网格图的算法进行了比较,该算法是参考文献[7]中的2D占用网格图的直接扩展。在两个连续会话之间,事件被定义为在场景中添加或移除对象。将对象从场景中的一个位置移动到另一个位置包括两个事件。数据集中共有42个动态事件。标识被定义为组件被标记为动态。如果该分量对应于真实动态事件,则该标识被定义为真阳性。查准率和查全率分别定义为真阳性数与识别数和事件数的比值。计算时间作为效率的指标。 结果是根据所有会话中的动态事件计算的。在表3中,可以看出,所提出的方法在查准率和查全率方面都优于基于3D占用网格的方法。其主要原因是占用网格图中的网格被平等对待。当两个占用网格图第六章现场一瞥。上一行显示第一个会话中的场景,而下一行显示第二个会话。人们可以看到中间的瓶子和马克杯在第二次会议中被移除右侧的黄色框在第二个会话中移动此外,一个人坐在旁边的办公桌出现在第二次会议。100Y. Wang等人/CAAI Transactions on Intelligence Technology 1(2016)90e 103图第七章左侧是通过多会话SLAM使用所有帧而不考虑低动态性重建的地图右图是用该方法重建的地图比较地图以导出动态,每个网格的噪声容限是网格的大小,这可能对有噪声的RGBD传感器测量非常敏感,特别是当由于相对于增长的深度的增加的不确定性而导致深度大时。如果网格尺寸被扩大以增加噪声的容限,则分辨率退化。然而,在我们的模型中,网格中的点被投影回深度图像平面,然后可以在图像平面中建模噪声容限,这与网格的大小是解耦的,因此更适合RGBD传感器。此外,85.4倍的计算速度,这可能会通过实现细节来争论,至少可以表明我们的方法通过用矩阵乘法代替昂贵的光线投射而更加有效,验证了我们在第4节中的假设。6.4. 10-会话结果为了进行定量比较,在本实验中测试了三个框架,包括:无修剪多会话姿态图SLAM使用所有信息而不进行任何修剪(可以实现的最佳姿态估计。它被用作基准)。● 框架我过时的姿势修剪边缘化。● 框架二:过时的姿势修剪、冗余的姿势修剪、边缘化。表3动态事件识别的比较。[7]第七话#识别34 31#真正的阳性2924精密度0.8530.774召回F-测量0.7630.632相对时间1£85.4×为了评估性能,最后两个方案与第一个方案在低动态环境中的10会话SLAM中进行比较。桌面上的对象在会议期间被添加、删除或移动在一些连续的会话之间,映射设置为静态,以显示Framework I和Framework II之间的差异。在图1中示出了通过SLAM使用所有信息在10个会话之后重建的地图,其中可以看到一些对象出现多于一次。实际上,每个物体的数量都是1。因此,地图很难提供准确的环境信息,不适合一些基于网格或八叉树的定位和导航技术。使用所提出的框架进行10次会话后的结果如图1所示,其中每个对象出现在其最终位置。在系统中保持的每个会话之后的姿态图的大小在图8中示出。会话8和会话9以及会话1和会话2之间没有动态。然后在图8中,在这些会话期间框架I的图的大小具有与无修剪相同的增加趋势,这指示如果环境是静态的,则框架I将退化为无修剪。然而,框架II工作在低动态和静态环境中,因为它的大小在10个会话期间保持有界。对于基于图像的定位技术,所有这些方案都有效,因为它们保存了当前会话中的图像,但框架II具有最小的搜索空间,因为它的图尺寸最小。图8中示出了应用于图优化的时间。注意,用于优化的图的大小不同于图8中所示的大小,图8中所示的大小是修剪之后的大小。但是可以看到,在有变化和没有变化的环境为了评估准确度,与无修剪框架相比,采用类似于[25]结果如图9所示。在这个数据集中,人们可以看到差异是毫米级的。在这里,我们不会说哪一个更准确。我们想展示的主要内容是,10次会话后的错误水平仍然是可以接受的。●Y. Wang等人/CAAI Transactions on Intelligence Technology 1(2016)90e 103101图八、会话期间图大小(左)和优化计算时间(右)的演变图第九章会话期间平移(左)和旋转(右)的相对姿态准确度测量的演变6.5. 外部5会话数据集结果No Pruning和Framework II应用于外部5-session数据集以进行进一步的性能评估。与10个会话的结果一样,图的大小、计算时间、RRD和RTD是性能的指标。每次会议后都有环境变化。在第一和第二会话以及第三和第四会话之间,所识别的动态被放大并在图10中展示。可以看出没有假警报。然而,在第三和第四会话之间,未识别出工业机器人的控制面板的移除。图11中示出了图大小的演变和用于优化的计算时间。无修剪的图大小保持单调增加。NoPruning和Framework II之间的差距也在增长,这表明当Framework II的最大大小低于30时,无法控制No Pruning的趋势,正如预定义参数所期望的那样。对于计算时间,两个框架都在不断增加,而No Pruning增长得更快。理论上,框架II的计算时间复杂度是关于先前会话和当前会话中的图大小的总和,因此是恒定的。最后1个会话中计算时间的上升是由于最后1个会话中的大量姿势。从长期来看,由于会话3之后图的大小已经稳定,并且会话中的姿势数量是有界的,因此可以保证保持稳定。在图12中,平移和旋转两者的差异是非累积的,如在10个会话数据集中测试的。请注意,翻译中的误差水平以毫米为单位,与10个会话数据集的误差水平一致。因此,外部数据集进一步验证了所提出的框架,其性能与分裂数据集相似。6.6. 讨论在实验室和工业机器人工作空间中,过期扫描识别存在三种典型故障:(1)RGBD传感器捕获的小目标通过增加网格的分辨率可以解决这一问题。(2)该算法将两个对象视为一个动态对象。如果不考虑对象的高级对象分割或检测,则不能解决该问题。(3)对象将被删除,但新对象将添加到相同位
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 新代数控API接口实现CNC数据采集技术解析
- Java版Window任务管理器的设计与实现
- 响应式网页模板及前端源码合集:HTML、CSS、JS与H5
- 可爱贪吃蛇动画特效的Canvas实现教程
- 微信小程序婚礼邀请函教程
- SOCR UCLA WebGis修改:整合世界银行数据
- BUPT计网课程设计:实现具有中继转发功能的DNS服务器
- C# Winform记事本工具开发教程与功能介绍
- 移动端自适应H5网页模板与前端源码包
- Logadm日志管理工具:创建与删除日志条目的详细指南
- 双日记微信小程序开源项目-百度地图集成
- ThreeJS天空盒素材集锦 35+ 优质效果
- 百度地图Java源码深度解析:GoogleDapper中文翻译与应用
- Linux系统调查工具:BashScripts脚本集合
- Kubernetes v1.20 完整二进制安装指南与脚本
- 百度地图开发java源码-KSYMediaPlayerKit_Android库更新与使用说明
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功