SRDA：低成本高效3D扫描实例分割技术

84 浏览量更新于2024-06-20 收藏 2.27MB PDF 举报

"SRDA是一种利用3D扫描、推理和领域自适应技术的低成本高效实例分割方法，旨在降低注释数据的人力成本。该技术适用于主要为室内和部分室外场景，尤其在计算机视觉中的实例分割问题上。SRDA通过结合3D扫描获取场景信息，运用推理技术处理数据，再借助GAN（生成对抗网络）进行域自适应，从而在小规模人力投入下生成大量训练样本。尽管计算机图形仿真可以提供无限的图像源，但其视觉真实性和现实世界的匹配度以及3D模型库的局限性是当前面临的主要挑战。SRDA在显著降低人力成本（如仅需2人小时即可处理4000至6000张图片）的同时，仍能实现较高的实例分割性能（如mAP达到77.02和86.02）。" 在计算机视觉领域，实例分割是一项关键任务，它需要区分图像中相同类别但不同个体的对象，提供比对象检测和语义分割更精细的分析。传统的实例分割方法依赖于大量带有注释的训练数据，而这些数据的收集和标注往往耗费巨大。SRDA（Scene Scan, Reasoning, and Domain Adaptation）是针对这一问题提出的一种创新解决方案。 SRDA的工作流程主要包括三个核心部分：首先，利用3D扫描技术获取场景的三维信息，为后续处理提供基础；其次，通过推理算法对扫描数据进行处理和解析，提取实例级别的信息；最后，采用基于GAN的域自适应策略，将扫描数据与实际环境进行融合，使得在新的环境和对象中也能实现较好的泛化能力。尽管现代仿真技术可以生成高度逼真的图像，但在模拟真实世界的新环境时，常常会遇到3D模型库中缺乏某些现实对象的问题，导致仿真图像与真实世界之间存在差距。SRDA通过结合实际3D扫描数据，能够在一定程度上解决这个问题，提高实例分割的准确性和适用性。 SRDA的实际应用中，展示了在极低的人力成本下（例如，2人小时处理4000到6000张图像），仍然能够达到相当的实例分割性能（如平均精度mAP分别达到77.02和86.02），这在处理大规模数据集和应对新环境时具有显著优势。总结来说，SRDA是一种有效的实例分割技术，通过集成3D扫描、推理和域自适应，成功地降低了注释数据的创建成本，提高了训练效率，对于扩展计算机视觉的应用范围，特别是在需要处理大量新环境和对象的场景中，具有重要的价值。

徐文强、李永禄、卢策武

与CycleGAN相反，Benaim等人[2]学习单边映射。使用GAN细化渲染

图像也不是未知的[33，32，3]。我们的工作是对这些方法的我们将比

较[32，3]与我们的GeoGAN在第二节。7.第一次会议。

一些研究人员试图为视觉任务生成合成数据，例如视点估计[35]，

对象检测[11]，语义分割[30]。在[1]中，Alhaija et al.解决了在生产逼真

地渲染和定位的汽车的技术努力下用于街道场景的实例分割训练数据

的生成。然而，他们专注于街头场景，并没有使用对抗性的提法。

通过计算机图形的场景生成通过CG技术的场景生成是计算机图

形社区中的一个研究良好的领域[13，25，34，9，26]。这些方法

能够生成室内或室外场景的合理布局，但它们没有意图将渲染的

图像转移到真实域。

扫描过程

在本节中，我们将介绍扫描过程。由于比例问题，对象和场景

我们选择多视图环境（MVE）[10]来执行对象的密集重建，因为它

是基于图像的，因此只需要RGB传感器。物体首先被录像，这可以很

容易地通过大多数RGB传感器完成在实验中，我们使用iPhone5s。视

频被切片成具有多个视点的图像我们可以对多个对象（至少4个）进

行录像，并每次生成相应的模型，这可以缓解新对象太多而无法逐个

扫描时的可扩展性问题MVE能够生成具有精细纹理的密集网格。对于

无纹理的对象，我们用手握住扫描对象，并且手-对象交互可以是用

于重建的有用线索，如[39]所示。

对于环境背景，使用Intel RealSense R200扫描没有目标对象的场

景，并使用ReconstructMe

重建。我们按照官方指示进行重建。

iPhone5s 的分辨率为 1920×1080 ， R200 的分辨率为 640×480 （ 60

FPS）。其余设置为默认设置。

用推理

4.1

场景布局知识构建

有了物体和环境背景的3D模型，我们就可以通过我们的推理系统生

成场景。一个合适的场景布局必须遵循物理定律和人类习惯。为了使

场景物理学变得合理，我们选择了一个现成的物理引擎，Project

Chrono [37]。然而，它并不像

http://reconstructme.net/

剩余16页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

SRDA：低成本高效3D扫描实例分割技术

高效简洁的一种图像分割方法

MES数据建模客户端系统

python基于Django的二手电子设备交易平台设计与开发毕业论文.docx

基于 MPPT 的光伏 (PV) 系统simulink.rar

springboot基于springboot的游戏创意工坊与推广平台的设计与实现 毕业论文.docx

u22喷气发动机3D数模图纸 STEP格式 附PDF二维图纸.zip

2023-04-06-项目笔记 - 第二百五十一阶段 - 4.4.2.249全局变量的作用域-249 -2025.09.09

SimBreakpoint Tool 有助于在给定模型中设置条件断点以进行调试.rar

springboot基于Hadoop的个性化图书推荐系统的设计与实现毕业论文.docx

基于ssm的校园活动管理平台设计与实现.docx

最新资源

springboot基于springboot的游戏创意工坊与推广平台的设计与实现毕业论文.docx

u22喷气发动机3D数模图纸 STEP格式附PDF二维图纸.zip