室内环境中动态物体实例的3D重定位:RIO方法与3RScan基准

0 下载量 137 浏览量 更新于2025-01-16 收藏 17.83MB PDF 举报
RIO(3D物体实例重新定位)是一项前沿的计算机视觉任务,目标是在室内环境中,给定一个或多个在先前RGB-D扫描中的物体,精确估计它们在稍后时间点的另一个3D扫描中的6DoF(六度自由度)姿态,即位置和旋转。这个任务的重要性在于它能支持各种实际应用,比如AI助手和机器人在三维空间中寻找特定物体,对于动态场景理解和室内导航等领域具有重要意义。 为了推动这一领域的研究,研究者开发了名为3RScan的新数据集,包含1482个RGB-D扫描,跨越478个不同的环境,且每个场景都记录了随着时间推移物体位置的变化,还提供了物体实例的精确标注以及与后续扫描的6DoF映射。这些数据集的创建是为了模拟真实世界中物体可能遇到的复杂变化,如不同部分的观察角度和环境的动态影响。 解决RIO任务的关键挑战在于处理部分观测和环境变化导致的特征匹配难题。传统的特征匹配方法往往在这样的情况下表现不佳。因此,研究团队提出了一个创新的数据驱动方法,采用全卷积3D对应网络在多空间尺度上操作,有效地找出匹配特征。这种网络架构能够适应复杂的空间结构和动态场景,提高了特征匹配的准确性。 为了评估其性能,研究者设计了专门的基准,并通过6DoF姿态优化进一步提升了方法的精度。结果显示,他们的方法在3RScan基准上达到了30.58%的准确率,相较于现有基线方法有显著优势。这标志着他们在解决动态室内环境中3D物体实例重新定位问题上取得了突破,为未来的研究者提供了一个有价值的研究平台和技术参考。