0。3或相对误差> 0。1分类阈值:我们在实验中观察到我们的得分和度量取决于用于在移动点或静止点的情况之间切换的良好校准的阈值P_stat。由于我们的训练流水线已经在Tr的计算中要求该阈值用于权重,因此我们需要在线机制来调整该阈值,而不是在后处理期间选择它。因此,我们跟踪我们想要针对可能阈值p〇、p1、… pN.然后,我们可以用下式定义阈值p_stat=p_ii= argminm(pi)(12)i =0,…,N作为我们的度量当前最优的点。 它是IM-值得注意的是,在自监督训练的情况下,我们只使用k-近邻误差ei和er,i,它们13131H其中EE> 0的ROutl点比率。3,相对误差> 0。3为了确保与先前工作的可比性,我们将Outl报告为KITTI-SF上的度量,然而,我们发现它具有若干缺点,最值得注意的是Outl和AccR的总和通常大于100%,这对于离群值度量是违反直觉的。在其他数据 集 上 , 我 们 专 门 报 告 了 上 文 定 义 的 稳 健 变 体ROutl。这两个指标的更详细的讨论和直接比较可以在补充材料中找到。由于我们调查的其他数据集包含移动场景部分w.r. t的较大不平衡。固定的,我们分别报告这两个班级的分数。地面实况测距法用于计算非刚性流分量fnr,gt,i=fgt,i−(Ot−1t+1−I4)pi.非刚性点不需要任何地面事实标签,但也只有大约-流量大于m转thresh =5厘米(相当于1.8公里)13132图3:KITTI-SF场景中方法的定性比较根据AccR准确估计的流量为蓝色,不准确的预测为红色。从左至右:PointPWCNet(PPWC),PoseFlowNet(PF),Ours被标记为动态的,其余的被标记为静态的。我们引入AEE 50-50作为分别在静止点和移动点上测量的AEE之间的平均值。基线:我们选择了两种方法作为基线,它们为场景流的自我训练和监督训练提供了最新的最先进的结果:我 们 比 较 的 第 一 个 基 线 是 PointPWCNet ( PPWC )[53],它使用类似于RAFT [39]的主干,因为它也依赖于其架构内部的相关卷。第二个基线取自[42],并学习预测与非刚性流分开的流的自我运动分量,类似于我们的在下文中,我们 将该方法称为PoseFlowNet(PF)数据集:为了获得有代表性的结果,我们使用了三个非常不同的户外交通场景数据集,它们的共同点是它们通过LiDAR从参与交通的(自主)车辆的位置观察场景。此外,我们使用FT3D [24]作为基线作为训练数据。FlyingThings3D:两种基线方法都广泛使用了FT3D [24]数据集,由随机飞行的物体组成。点云和流是1对1对应的,并且具有比来自其他数据集的对应物显著更多的点。该数据集不适合于我们的方法,因为我们假设流动主要在水平x,y平面中,并且同一支柱内的点这两个假设都不适用于这个数据集,因此我们不使用它来训练我们的方法。nuScenes:nuScenes [5]是使用Velodyne VLP32 LiDAR传感器记录的自动驾驶(AD)数据集,具有空间和时间上的密集注释对象框我们使用记录的静态点的车辆里程计和移动对象的跟踪信息(边界框),用地面实况信息注释点云。CARLA:使用CARLA模拟器[8],我们收集了一个人工数据集,其中包含142k个连续点云和地面实况流注释。Town07专门用于评估,我们记录了1,900个不同的场景。KITTI:KITTI-SF [26]训练数据集被许多作品用作3D场景流的主要基准[21,53,42,18]。对于这142个样本,给出了立体地面实况和流注释,允许将数据集转换 为 具 有 场 景 流 标 签 的 点 云 表 示 。 与 nuScenes 和CARLA数据集相比,它由成对的1对1对应的点云和流组成,这与在不同时间步长测量的真实世界点云不同。我们还将我们的方法与该数据集上的基线进行了比较。对于训练,我们使用KITTI [9]数据集(缩写为KITTI-RL)发布的未标记原始LiDAR点云的整个集合。4.2. 点云密度我们的网络架构能够处理来自KITTI-RL的完整场景作为输入,包括大约64,000个点。虽然在理论上,基线可以在类似的大小上运行推理,但在训练期间,由于内存需求和训练时间急剧增加,运行超过8,192个点的基线是不可行的因此,增加的点云密度不仅提供更多的信息,而且还表示在推理期间网络的域我们的第一组实验显示了哪种类型的评估对基线和我们的方法产生更好的结果,并确定了我们在下面的实验中使用的评估模式。表1示出了这些实验的结果我们在FT 3D上以自我监督的方式训练基线,因为在KITTI-SF上评估时,它会给他们最好的分数。对于我们的网络,我们在KITTI-RL上训练自监督,因为它反过来会在KITTI-SF上产生最佳结果。我们的结论是,这两个基线遭受域移位由于不同的点密度,并没有受益于增加的分辨率。因此,我们总是在下采样点云上评估基线,并且我们的13133↓ ↑↓所所↓ ↑↓≈评估数据#点AEE↓ AccS↑ AccR↑ Outl↓表1:点云密度的影响我们的方法(*)是在KITTI-RL上训练的。2019 - 06 -21 0.1610 0.2035 0.5809 0.781165536 0.1654 0.1999 0.5783KITTI-SF81920.3466 0.0820 0.3145 0.8233表3:nuScenes上的自监督训练评估移动状态50-50AEE AccR ROutl AEE AEE零0.6381 0.16320.5783 0.52480.58141999年12月31日电话:+86-021 - 8888888传真:+86-021- 88888888我们的0.1050 0.7365 0.0240 0.09250.0987全部0.3648 0.0726 0.2974 0.8579819265536KITTI-SF8192KITTI-SF81922019 - 06 - 22 00:00:002017年12月31日0.30090.09862019年12月31日0.1207 0.5178 0.79560.40240.0668 0.7695 0.9342表4:对CARLA的自我监督训练评估移动状态50-50AEE AccR ROUTI AEE AEE零0.4049 0.18050.4753 0.47520.4401表2:具有域转移的自监督训练,在KITTI-SF列车数据AEE↓ AccS↑ AccR↑ Outl↓粤ICP备05016666号-1nuScenes 0.7708 0.0897 0.2078 0.9193(a)秘书长的报告KITTI-RL 0.37120.1992 0.4092 0.7406粤ICP备16039999号-1nuScenes 0.4628 0.0000 0.1356 1.0000(a)秘书长的报告KITTI-RL 0.4448 0.0526 0.2310 0.9885nuScenes 0.1013 0.7156 0.8739 0.3046(a)临时工作人员KITTI-RL0.0668 0.7695 0.9342 0.2488方法对全点云。4.3. 训练数据集和域转移基线已经在KITTI-SF上进行了评估,网络在FT 3D上进行了训练。我们发现,我们的方法在KITTI-SF上的表现完全不同,这取决于训练过程中使用的数据集。因此,表2示出了针对不同训练数据集的KITTI-SF上的自监督模型的验证性能。我们的方法给出了最好的结果KITTI-RL。这是有意义的,因为除了KITTI-SF中的小相机FoV之外,几何属性及其分布匹配。当在FT3D上训练时,基线给出的结果比在任何其他数据集上更好。然而,在其他三个LiDAR数据集中,KITTI-RL似乎是最佳选择。FT 3D比KITTI-RL 工作得 更好也并不 奇怪,因为 它更像KITTI-SF中发现的相机FoV。定性结果见图。3.第三章。4.4. LiDAR数据为了更接近真实世界的评估,我们在没有点对应的两个注释数据集CARLA和nuScenes上进行自监督实验。与静态点相比,两个数据集都表现出移动点的大得多的不平衡(非刚性流> m阈值)。在KITTI-SF中,大约40%的点在移动,而在nuScenes和CARLA中只有5%在移动。因此,我们分别计算AEE和Acc分数,并报告新引入的AEE 50-50,以便于比较方法。表3示出了nuScenes数据集的结果,表4示出了CARLA的结果,其中我们在相应的数据集上训练了我们的方法以及基线。可以看出,两种基线方法的性能都比我们的方法差得多。然而,将他们的结果与他们在KITTI-SF上实现的结果进行比较表明,当在更真实的数据上进行训练时,这些方法本身没有丢失对应性的真正问题4.5. 有监督流量预测最后,我们给出了每种方法在不同数据集上的最佳结果。除了我们的方法和KITTI-SF数据集的情况外,所有结果都是使用监督训练实现的。在这里,我们的方法在KITTI-RL上进行自监督训练时表现最好,而在其他两个注释数据集上进行监督训练时表现最好,证明了我们的自监督模型的能力表5和表6表明,我们的方法大大优于基线w.r.t.几乎所有的指标。KITTI-RL和KITTI-SF之间的域间隙是所有域中最小的,因此我们的网络使用自监督在KITTI-SF上实现了最佳结果其他方法都无法获利从小的畴隙到相同的程度。在nuScenes和CARLA的情况下,基线会发生-PF我们我们PPWCPPWCPFFT3DFT3DPPWC0.3811 0.0948 0.50570.2577 0.3194PF0.5711 0.00850.1093 0.3402我们0.0809 0.8351 0.05280.0853 0.083113134nuScenes卡拉表5:所有方法在KITTI-SF上的最佳结果注表7:nuScenesPPWC和PF接受全面监督培训,同时我们的方法仅使用自我监督。方法训练数据AEE↓ AccS↑ AccR↑ Outl↓PPWC FT3D 0.2578 0.1803 0.4838 0.7176PF FT3D 0.1743 0.2716 0.5830 0.8729自我监督logit自我确认移动Stat.50-50介绍aggr.重量AEE AEE AEE0.1214 0.18890.1050 0.0925 0.0987✓ 0.1413 0.1100 0.1256我们的KITTI-RL0.0668 0.7695 0.9342 0.2488表6:最佳监督结果监督✓ ✓✓ ✓0.1530 0.14010.09330.04740.07040.07020.04990.0600移动状态50-50方法AEE ↓AccR ↑ROutl ↓AEE ↓AEE↓2006 - 2007年电话:+86-021 -88888888传真:+86-021 - 88888888我们的(a)在2004年12月31日之前电话:+86-021 - 88888888传真:+86-021 -88888888我们的0.0702 0.8921 0.01700.04990.0600与移动点的不平衡成角度。特别是PF实现了有希望的结果的固定点,甚至优于我们的方法在nuScenes。然而,它完全忽略了移动对象。相比之下,我们的方法使用移动分类阈值,因此优雅地完全适应移动点数量变化的数据集。我们得出结论,我们的方法稳健地处理具有大约5cm的一致流AEE 50-50的不同数据集,而基线在更现实的数据集上表现得截然不同4.6. 消融研究我们现在进行一系列实验,以消除单个组件的重要性,从我们最基本的设置开始:具有RAFT主干作为强基线的PP编码器[20],参见表7。我们首先修改RAFT主干以更新和跟踪流图以及分类逻辑,我们使用分类逻辑将聚合步骤应用于掩蔽的自我运动流图,以便调节运动场以提高场景的静态部分的准确性。然后,引入用于产生由聚合步骤使用的权重的另一个logit图,在理论上,允许网络选择具有高流量确定性的区域,并且导致对静态场景元素的甚至更强的性能。对于监督训练,我们观察到性能的稳定改善。然而,在自我监督的情况下,我们观察到的信心权重不产生进一步的改善相比,纯聚合。我们将此归因于以下事实:在自监督训练期间,仅通过非常嘈杂的kNN残差更新移动阈值。这不足以将移动阈值引导到最佳校准。第关于更详细的分析,我们参考补充材料。4.7. 运动分割如表7所示,运动分割提高了场景流性能。定性分析图中的logits。4揭示了网络确实学会了从点云中挑选移动对象。通过在KITTI-RL上进行自我监督训练,我们的模型在KITTI-SF上的mIoU得分为59.5%,灵敏度为73.1%。关于运动分段的更详细的讨论可以在补充材料中找到。图4:左:地面实况运动分割,右侧:预测的动态性,更高的移动概率更亮5. 结论我们介绍了SLIM,这是一种用于LiDAR场景流估计的新方法,它通过几个关键贡献改进了最先进的技术:我们提出了一种新的网络设计,允许我们在更大的点云上进行训练和评估,从而消除了下采样的需要。我们的模型分类静止和移动的场景部分。我们证明了静态流的所得聚集导致刚性流场的显著改善,进而使得能够更好地自监督分类成静止点和移动点。在未来的工作中,我们计划探索更好的正则化策略和更多的自我监督信号,以进一步增强我们的方法。6. 确认AndreasGeiger得到DFG EXC编号2064/1-项目编号390727645的支持。B joürnOmmer在“KI Absicherung -自动驾驶安全AI”项目中得到了德国联邦政府BMWi的支持13135引用[1] Tali Basha,Yael Moses,Nahum Kiryati。多视图场景流估计:一种视图中心变分方法。国际计算机目视,101(1):6[2] AseemBehl,DespoinaPaschalidou,SimonDonne',andAn-dreas Geiger.Pointflownet:从点云学习用于刚性运动估计的表示。在IEEE计算机视觉和模式识别会议上,CVPR 2019,长滩,加利福尼亚州,美国,2019年6月16日至20日,第7962计算机视觉基金会/ IEEE,2019年。[3] Jens Behley , Martin Garbade , Andres Milioto , JanQuen-zel,S v enBehn k e,CyrillStachniss,andJürgenGall.Se-mantickitti:激光雷达序列语义场景理解数据集。在2019年IEEE/CVF国际计算机视觉会议,ICCV 2019,韩国首尔(南),2019年10月27日至11月2日,第9296-9306页。IEEE,2019。[4] Pia Bideau,Rakesh R. Menon,and Erik G.学习米勒。Moa-net:自监督运动分割。在Laura Leal-Taixe和StefanRoth,编辑,计算机视觉- ECCV 2018研讨会-德国慕尼黑,2018年9月8日至14日,会议记录,第六部分,计算机科学讲义第11134卷,第715-730页。Springer,2018.[5] 放大图片作者:Holger Caesar,Varun Bankiti,AlexH.Lang,Sourabh Vora,Venice Erin Liong,Qiang Xu,Anush Krishnan , Yu Pan , Gi- ancarlo Baldan , andOscar Beijbom.nuscenes:自动驾驶的多模态数据集。2020年IEEE/CVF计算机视觉和模式识别会议,CVPR2020,美国华盛顿州西雅图,2020年6月13日至19日,第11618-11628页。IEEE,2020年。[6] 罗德里戈湖Carceroni和Kiriakos N.库图拉科斯通过surfel采样的多视图场景捕获:从视频流到非刚性3d运动,形状和反射。国际期刊。目视,49(2-3):175[7] 陈宇华,考迪莉亚·施密德,克里斯蒂安·斯明奇斯-埃斯库.单目视频中具有几何约束的自监督学习:连接流量,深度和摄像头。在2019年IEEE/CVF国际计算机视觉会议,ICCV 2019,韩国首尔(南),2019年10月27日至11月日,第7062-7071页。IEEE,2019。[8] AlexyDos o vitski y,Germ a´ nRos,FelipeCod e villa,Anto-nioM. 洛佩斯和弗拉德伦·科尔通。CARLA:开放式城市驾驶模拟器。在第一届机器人学习年会上,CoRL 2017,Mountain View,California,USA,2017年11月13日至15日Proceedings,Proceedings of MachineLearning Research , 第78 卷 ,第 1-16 页 PMLR , 2017年。[9] Andreas Geiger , Philip Lenz , Christoph Stiller , andRaquel Urtasun.视觉与机器人技术的结合:KITTI数据集。国际机器人研究杂志,32(11):1231[10] Cle' mentGodard , OisinMacAodha , MichaelFirman ,andGabriel J. Brostow.深入研究自我监督的单目深度估计。在2019年IEEE/CVF国际计算机视觉会议,ICCV2019,韩国首尔(南),2019年10月27日至11月2日,第3827-3837页。IEEE,2019。[11] 放大图片作者:J.Guibas和Tolga Birdal。刚性三维场景流的弱监督学习。CoRR,abs/2102.08945,2021。[12] Xiuye Gu,Yijie Wang,Chongruo Wu,Yong Jae Lee,and Panqu Wang. Hplflownet:Hierarchical permutohedrallattice flownet for scene flow estimation on large-scalepoint clouds.在IEEE计算机视觉和专利识别会议
下载后可阅读完整内容,剩余1页未读,立即下载
- 粉丝: 5
- 资源: 2万+
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 构建基于Django和Stripe的SaaS应用教程
- Symfony2框架打造的RESTful问答系统icare-server
- 蓝桥杯Python试题解析与答案题库
- Go语言实现NWA到WAV文件格式转换工具
- 基于Django的医患管理系统应用
- Jenkins工作流插件开发指南:支持Workflow Python模块
- Java红酒网站项目源码解析与系统开源介绍
- Underworld Exporter资产定义文件详解
- Java版Crash Bandicoot资源库:逆向工程与源码分享
- Spring Boot Starter 自动IP计数功能实现指南
- 我的世界牛顿物理学模组深入解析
- STM32单片机工程创建详解与模板应用
- GDG堪萨斯城代码实验室:离子与火力基地示例应用
- Android Capstone项目:实现Potlatch服务器与OAuth2.0认证
- Cbit类:简化计算封装与异步任务处理
- Java8兼容的FullContact API Java客户端库介绍