从3D数据中准确恢复超椭球的概率方法

94 浏览量更新于2023-10-25 收藏 16.54MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

Interpreting objects with basic geometric primitives haslong been studied in computer vision. Among geometricprimitives, superquadrics are well known for their abil-ity to represent a wide range of shapes with few parame-ters. However, as the first and foremost step, recoveringsuperquadrics accurately and robustly from 3D data still re-mains challenging. The existing methods are subject to lo-cal optima and sensitive to noise and outliers in real-worldscenarios, resulting in frequent failure in capturing geomet-ric shapes. In this paper, we propose the first probabilisticmethod to recover superquadrics from point clouds. Ourmethod builds a Gaussian-uniform mixture model (GUM)on the parametric surface of a superquadric, which explic-itly models the generation of outliers and noise. The su-perquadric recovery is formulated as a Maximum Likeli-hood Estimation (MLE) problem. We propose an algorithm,Expectation, Maximization, and Switching (EMS), to solvethis problem, where: (1) outliers are predicted from the pos-terior perspective; (2) the superquadric parameter is opti-mized by the trust-region reflective algorithm; and (3) lo-cal optima are avoided by globally searching and switch-ing among parameters encoding similar superquadrics.We show that our method can be extended to the multi-superquadrics recovery for complex objects. The proposedmethod outperforms the state-of-the-art in terms of accu-racy, efficiency, and robustness on both synthetic and real-world datasets. The code is at http://github.com/bmlklwx/EMS-superquadric_fitting.git.26760鲁森 1 , 2 吴宇伟 1 阮思普 1 Gregory S. Chirikjian 1 *0{ mpewxl, yw.wu, ruansp, mpegre } @nus.edu.sg01 新加坡国立大学 2 约翰斯∙霍普金斯大学0摘要01. 引言0理解3D环境（以及其中的对象）一直是计算机视觉和智能系统的重要任务 [ 24]。随着3D视觉的突破和计算能力的提升，现代计算机视觉系统能够使用低级表示重建和推理场景，例如点云0* 通讯作者0图1.（a）凸超椭球的形状词汇。我们专注于用凸超椭球解释点云。（b）我们方法推断的超椭球表示。0云 [ 11 , 25 , 26 ]，网格 [ 18 ] 和体素 [ 9 , 38]。相比之下，人类视觉系统更倾向于将场景抽象为规范部分，以获得更好的感知理解 [ 3 , 15]。人类视觉似乎能够很好地处理场景的基本几何结构，而不依赖于详细的逐点模型 [ 24]。因此，理解视觉输入的几何结构似乎是智能系统实现高级目标（如物理推理、决策、规划和与环境的交互）的一种有前途的方法。受到这个想法的启发，研究人员开始探索使用基本体积原语进行对象描述的可能性，例如立方体 [ 20 , 33 , 39]。然而，由于立方体的表达能力有限，对象只能以高度抽象的方式进行描述。超椭球是一类具有丰富形状词汇的几何原语，包括立方体、圆柱体、椭球体、八面体及其中间形状（图1），但只由5个参数编码。近几年，超椭球在社区中引起了相当大的关注，并广泛应用于机器人学和计算机视觉任务，例如对象建模 [ 5 , 22 , 23]，碰撞检测和运动规划 [ 28 , 29 ]，姿态估计 [ 4 ]和抓取 [ 27 , 36, 37 ]。单个超椭球已经足够表达许多日常物体 [ 14 , 30]。关于单个超椭球恢复的开创性工作包括 [ 1 , 12 , 32]，其中恢复被公式化为最小二乘（LSQ）问题。在 [ 6 , 16]中，这些方法被扩展为使用多个超椭球模型复杂对象。然而，现有的方法容易受到局部最优解的影响，并对真实场景中的噪声和异常值敏感，导致频繁失败于捕捉几何形状。在本文中，我们提出了第一个从点云中恢复超椭球的概率方法。我们的方法在超椭球的参数化表面上构建了一个高斯-均匀混合模型（GUM），该模型明确地模拟了异常值和噪声的生成。超椭球恢复被公式化为最大似然估计（MLE）问题。我们提出了一种算法，Expectation,Maximization, and Switching(EMS)，来解决这个问题，其中：（1）异常值从后验角度进行预测；（2）通过信赖域反射算法优化超椭球参数；（3）通过在编码类似超椭球的参数之间进行全局搜索和切换来避免局部最优解。我们展示了我们的方法可以扩展到复杂对象的多超椭球恢复。所提出的方法在合成和真实数据集上在准确性、效率和鲁棒性方面优于现有方法。代码在 http://github.com/bmlklwx/EMS-superquadric_fitting.git 中。F(x) .=�� xax� 2ϵ2+� yay� 2ε2� ε2ε1+� zaz� 2ε1(1)26770由于噪声和异常值的存在，以及局部优化器的固有缺陷使得它们对初始化非常敏感。在本文中，我们专注于单个超椭球恢复问题，并提出了第一个从带噪声点云中恢复超椭球的概率方法。我们建立了一个概率模型，模拟了观测（点云）如何可能从给定参数化的超椭球曲面生成。我们采用GUM来适应噪声和异常值的生成。因此，超椭球恢复被形式化为MLE问题（第3.1节）。期望和最大化（EM）算法通常用于解决具有潜变量的MLE问题[10]。然而，EM算法通常收敛到局部最优解，导致形状近似不准确。为了解决这个问题，我们提出了一种新颖的算法，期望、最大化和切换（EMS），它利用超椭球的几何特征来避免局部最优解（第3.2节）。在E步中，从后验角度推断出点是异常值的概率（第3.3节）。在M步中，根据E步中潜变量的当前估计更新超椭球的参数（第3.4节）。E步和M步交替进行，直到收敛到局部最优解，我们引入了S步：全局搜索编码形状和姿态相似的候选参数的超椭球，然后切换到可以进一步增加似然性的超椭球（第3.5节）。这种策略是通过研究超椭球的几何对称性和代数模糊性而实现的。此外，我们还展示了我们的概率公式可以扩展到多超椭球恢复任务（第3.6节）。本文的动机和关键特点来自以下两个问题。（1）我们能否设计一个足够强大、准确和高效的算法，从噪声点云中抽象出一个最佳的超椭球基元，其底层形状确实在超椭球的词汇表中？这个问题在第4.1节和第4.2节中得到了回答。（2）如果点云太复杂，无法用单个超椭球近似，算法能否找出一个可以用超椭球近似的主要部分？这是一个具有挑战性的目标，任何现有的单个超椭球恢复算法都无法实现。我们在第4.3节定性地证明了所提出的方法能够做到这一点。02. 相关工作02.1. 初步：超椭球0超椭球是一族几何基元（图。01），可以由隐函数[2]定义：0其中 x . = [ x, y, z ] T ∈ R 3是在超椭球坐标系中定义的点；a x ，a y 和 a z ∈ R > 0是与x、y、z轴对应的尺度参数；ϵ 1 和 ϵ 2 ∈ R ≥ 0是形状参数。ϵ 1 控制沿z轴的形状，ϵ 2控制垂直于z轴的形状。如果ϵ 1 和 ϵ 2 都在(0,2]范围内，则超椭球是凸的。方程（1）也被称为“内外”函数，因为如果F(x)=1，则x位于曲面上，如果F(x)<1，则位于内部，否则位于外部。我们能够完全参数化具有θ的一般姿态的超椭球。= {ϵ 1 ，ϵ 2 ，a x ，a y ，a z，g}，其中g = [R ∈ SO（3），t ∈ R 3 ] ∈SE（3）是欧几里德变换。02.2. 超椭球恢复0单个超椭球恢复在所有超椭球恢复问题中起着重要作用。在以前的工作中[1，12，13，32，35]，它被形式化为一个LSQ问题，并使用Levenberg-Marquardt（LM）算法[17]进行求解。最近，研究人员还探索了深度学习方法的可能性[21，31]。Solina等人[1，32]提出了一个基于超椭球隐函数的代价函数。Gross等人[12]通过点与超椭球曲面之间的径向距离修改了代价函数。在[13，34]中，研究了算法的鲁棒性，并通过自定义启发式函数随机拒绝异常值。所有上述方法在ϵ 1 或 ϵ 2接近0时都会遭受数值不稳定性的问题。因此，它们通过将ϵ1 和 ϵ 2的下界约束为0.1来进行妥协，这导致在建模具有尖锐边缘的形状（例如立方体和圆柱体）时准确性较低。最近，这个问题通过在不稳定区域中用辅助函数逼近隐函数来重新审视并解决[35]。此外，在[35]中，作者指出这些方法对初始化非常敏感，并建议尝试通过对点云执行主成分分析（PCA）获得的3个不同的初始猜测。然而，所有这些方法仍然受到局部最优解的影响，特别是当点云部分采样在物体表面时。对于多超椭球恢复，Leonardis [16] Borges[5]和Chevalier等人[6]尝试通过将点云分割成部分并对每个部分拟合超椭球来解释复杂对象。相比之下，我们的多超椭球恢复扩展以分层方式工作。除了多超椭球表示外，我们还可以获得超椭球之间的层次关系（图3）。多超椭球恢复的另一条线是基于深度学习[22，23]，其中超椭球可以从网格甚至RGB图像中获得。然而，他们的方法是数据驱动的，具有泛化的局限性，而我们专注于基于逐案例的概率推理来恢复未见过的现实世界对象。)ˆµi = arg minµi∈Sθp(µi|xi)(7)ˆµi = arg minµi∈Sθ∥xi − µi∥2(8)ˆµsi = xi −1 − F − ϵ12 (g−1 ◦ xi) (g−1 ◦ xi)(9)267803.我们的方法03.1.概率建模0在本节中，我们演示了如何将超椭球恢复问题建模为最大似然估计问题。我们的模型构建如下。首先，在由θ参数化的超椭球曲面Sθ�R3上，根据均匀密度函数随机采样一个高斯质心μ∈Sθ0p(μ)=10Aθ,Aθ=∫Sθ1dS(2)0Sθ1dS(2)0其中Aθ是超椭球曲面的面积。随后，观测值x∈R3从高斯-均匀模型（GUM）中生成，其概率密度函数如下所示0p(x|μ)=wopo(x)+(1−wo)N(x|μ,Σ)0其中N(∙|μ,Σ)表示具有均值μ和协方差Σ的高斯分布的密度函数。我们假设噪声是各向同性的，即Σ=σ2I，其中I∈R3×3是单位矩阵。引入均匀异常值组件来建模异常值的生成。wo∈[0,1]是采样点来自异常值组件的概率。为了使方程（3）成为一个合适的概率密度函数（在R3上积分为1），我们引入一个工作空间V，封装点集，其体积等于V。异常值组件的概率密度为po(x)=10如果x∈V，则p(x)=V；否则，p(x)=0。为了方便后续推导，我们通过引入一个潜在随机变量z∈{0,1}来将方程（3）重新表达为一个等价形式，该变量编码x的成员身份。当z=0时，x从均匀异常值组件中采样。相反，当z=1时，x从高斯内点组件中生成。我们假设成员身份z与高斯组件的均值μ是独立的。因此，方程（3）等价于0p(x|μ,z)=po(x)1−z∙N(x|μ,Σ)z0z�p(z)=Bernoulli(1−wo)0给定一组点X={xi∈R3|i=1,2,...,N}，可以通过最大化以下似然函数来估计超椭球曲面的参数0L(θ,σ2)=0i=1p(xi|μi,zi)p(μi)p(zi)0或等价地，最小化负对数似然函数0l(θ,σ2)=0i=1zi0||xi−μi||02σ2−logc+Nlog(Aθ)0其中c是高斯分布的归一化常数，定义如方程（3）。为简化起见，省略了与θ和σ2无关的项。03.2.期望、最大化和切换0方程（6）由于存在一组连续潜变量μi∈Sθ，i=1,2,...,N和离散潜变量zi∈{0,1}，i=1,2,...,N，因此无法直接求解。最常用的解决具有潜变量的最大似然估计的方法是EM算法[10]。然而，在我们的场景中，EM算法存在多个局部最优解，并且难以以精确形式计算潜变量的期望。因此，我们提出了一种新的算法称为EMS，它通过利用超椭球的几何特性改进了EM算法。该算法首先从后验的角度给出了当前超椭球参数估计下的潜变量估计（E步）。然后，通过最小化负对数似然函数（M步）来推断和更新参数。这两个步骤交替进行，直到收敛到局部最小值。然后，我们全局搜索候选参数，这些参数在几何上与当前估计的超椭球相似，但有进一步减小负对数似然函数的潜力（S步）。如果找到一个有效的候选参数，我们将用该候选参数重新初始化EM阶段；否则，我们宣布终止并返回最终结果。详细的动机和每个步骤的推导在下面的章节中讨论。03.3. E步骤：潜变量估计0给定当前的超椭球参数θ，我们通过最大后验估计（MAP）来估计µ i。0给定当前的超椭球参数θ，我们通过最大后验估计（MAP）来估计µ i。0据我们所知，方程（8）没有解析解，对于大量观测数据，数值优化耗时过长。因此，我们用次优解来近似估计 ˆ µ i，以保证最小化方程（6）。根据贝叶斯定理，我们证明了这等价于找到超椭球表面上离点x i 最近的点。0这是向量x i（在超椭球坐标系中定义）与超椭球表面Sθ的交点。F(∙)是超椭球的隐式函数。这个想法最早由[12]引入，用于建立超椭球拟合的径向距离度量。E(zi = 1|xi, ˆµsi) =N(xi|ˆµsi, σ2I)N(xi|ˆµsi, σ2I) + wopo1−wo(10)ˆl(θ, σ2) =Nˆzi∥xi − ˆµsi∥222σ2− log c+ N log(Aθ)26790给定µ i的当前估计，通过贝叶斯定理推断出 x i是内点的后验概率的期望。0为简单起见，我们将期望值表示为 ˆ z i。03.4. M步骤：参数优化0将µ i和z i在方程（6）中用它们的后验估计 ˆ µ s i 和 ˆ z i替换，我们得到一个更新的负对数似然函数。0（11）据我们所知，A θ不能用θ的闭合形式表示。为了提高效率，A θ 通过沿ϵ1和ϵ 2的双线性插值来近似。详细信息请参见补充材料。Nlog(A θ)表示对小超椭球的偏好。为了避免局部最优解，最好在σ2降到阈值以下时再引入这一项，即大致捕捉到形状。我们应用信赖域反射法[8]来优化θ。我们不使用LM求解器的主要原因在于当接近形状参数的下界时，它具有数值不稳定性。相反，经验上，反射变换[7]始终保持优化的数值稳定性。更多讨论可在补充材料中找到。求解θ后，通过将方程（11）的相应偏导数设为零来更新σ 2。03.5. S步骤：几何局部最优解避免0超椭球具有许多几何和代数特征，例如对称性和参数模糊性。可以提出一些平凡情况，其中两个超椭球具有相似甚至相同的形状和姿态，但在参数空间中相距较远。似然函数方程（11）量化了基础几何原始体与观测数据的拟合程度，因此两个相似（或相同）的超椭球也必须具有相似（或相同）的似然函数。受到这个想法的启发，我们提出了一种基于几何引导的局部最优解避免策略：全局搜索编码相似形状的候选参数，并切换到具有进一步增加似然函数潜力的参数。切换操作在参数空间中是不连续的，而在基础几何形状方面的变化几乎是平滑的。我们研究了两个相距较远的参数表示相似超椭球的条件，并将这些情况总结为两类。切换的思想和相似性的示例在图2中可视化。0图2.S步骤和相似性的可视化。EM步骤改变超椭球的形状和姿态，朝向局部最优解，而S步骤试图保持当前形状，但在远距离参数之间跳跃，以避免局部最优解。0轴不匹配相似性：根据第2.1节的定义，x轴和y轴在可互换性方面属于等价类，即，如果我们交换 a x 和 a y的值，可以通过绕z轴旋转90度获得相同的超椭球。然而，z轴与它们通常不可互换。因此，我们将z轴称为主轴。现在让我们考虑一个特殊情况，即当形状参数 ϵ 1 = ϵ 2时。在这种情况下，隐式函数（方程（1））退化，并使得所有三个轴等价。从另一个角度来看，随着 ϵ 1 和 ϵ 2之间的差异增加，互换性的‘程度’减少。因此，当 ϵ 1 和ϵ 2互相接近时，可以通过将主轴重新分配给x轴或y轴，然后应用相应的旋转来获得类似的超椭球。我们将其称为轴不匹配，因为它有助于避免由于主轴错误分配而导致的局部最优点，从而阻止形状进一步变化到全局最优点。对偶相似性：这种情况源于关于 ϵ 2 的形状模糊性。当 a x = a y 且 ϵ 2 = 0时，我们总是可以通过缩放 a x 和 a y 以及 1 / √的倒数来表示相同的超椭球（就形状和姿态而言）。02，设置 ϵ 2 = 2，并绕主轴旋转45度。这是因为 ϵ 2 = 0 和ϵ 2 = 2在与主轴正交的子空间中定义了一对互为对偶的正方形。利用这个性质，当 a x ≈ a y 时，可以通过设置 ϵ 2 = 2 - ϵ 2，重新缩放和旋转来构造类似的超椭球。对偶相似性对于避免局部最优点非常重要，因为它连接了参数空间的两个极端端点。局部优化器倾向于单调地收敛到其中一个端点，而对偶相似性将这些端点粘合在一起，允许算法检查和探索对应的端点。类似的超椭球也可以通过两种相似性的组合得到。关于候选生成和切换策略的详细数学公式10: end forerror(X, S) .= 1NN�i=1minsj∈S ∥xi − sj∥2(12)26800可以在补充材料中找到详细的数学公式。03.6. 扩展：多超椭球恢复0尽管我们的方法是为了单个超椭球恢复而设计的，但它可以轻松扩展到理解具有多个超椭球的复杂对象的形状和结构。我们单个超椭球恢复方法的一个关键特点是它可以捕捉到点云中主要的超椭球状部分，并将未拟合的点识别为‘异常值’。因此，从复杂对象的点云 X中，我们可以首先恢复一个捕捉主要超椭球结构的超椭球，以及一组未拟合的‘异常值’聚类 C 。然后，我们将 C作为输入反馈给算法，以恢复一组新的超椭球以及更新的 C。这个过程（算法1）在层次上重复，直到 C为空或达到最大层数。通过这种方式，不仅可以用获取到的超椭球的并集表示点云，还可以获得超椭球之间的层次关系，如图3所示。0算法1：分层超椭球恢复01: 输入：{ X 1 , X 2 , ..., X n } 2: 输出：{ θ 1 , θ 2 , ...,θ n } ， C = { ¯ X 1 , ¯ X 2 , ..., ¯ X m } 3: C ← {} 4:对于 i = 1 , ..., n 执行06: { ¯ X 1 i , ¯ X 2 i , ..., ¯ X γ i } ← 聚类（异常值）07: � 通过欧几里得距离对异常值进行聚类 [ 19 ]08: C ← C ∪ { ¯ X 1 i , ¯ X 2 i , ..., ¯ X γ i }09: � 小于阈值的点的聚类被修剪0图3. 多超椭球恢复的分层过程。我们以KITObjectModels中的一个Seal为例进行演示。 (a) 原始点云。 (b-d)分层过程和结构图的生成步骤。 (e) 恢复的超椭球模型。 (f)基于超椭球模型的原始点云分割。04. 实验0我们在合成和真实的点云数据集上进行实验，以验证我们方法的准确性、效率和鲁棒性。所有算法和实验均在MATLAB上实现，在一台运行Intel Corei9-9900K(3.6GHz)的计算机上运行。在所有单个超椭球恢复实验中，我们与4种基准方法进行比较：Implicit-LSQ[32]，Radial-LSQ [12]，Robust-fitting [13]和NumericalStable method[35]。初始化：根据[35]，如果没有指定，基准方法将通过主成分分析获得的3个不同超椭球参数进行初始化，以减轻局部最优的影响。为了展示所提出的局部最优避免策略的有效性，我们的方法只初始化一次，使用这三个参数中的第一个。实现细节可以在补充材料中找到。04.1. 合成数据集上的恢复0在本节中，我们评估算法在给定超椭球上采样点的情况下恢复底层几何原语的性能。设计了三个实验来评估对部分数据、异常值和噪声的鲁棒性。为了覆盖凸区域内超椭球的整个参数空间，我们随机生成500个超椭球，采用以下策略：形状参数[ϵ1，ϵ2]均匀采样于(0，2]2 �R2；尺度参数[ax，ay，az]均匀采样于[0.5，3]3 �R3；旋转R ∈SO(3)通过首先在单位球上采样旋转轴，然后在该轴上应用一个随机旋转[0，2π]生成；平移t均匀采样于[−1，1]3 �R3。通过在随机超椭球的表面均匀采样点云来生成，采样间隔为0.2（见[35]）。然而，由于该算法采样的点在接近z轴的极点处变得更密集。因此，我们通过自适应地重新缩放不同纬度上的采样间隔，以实现整体等距采样（见补充材料）。评估拟合质量的最自然度量是点到曲面的平均正交距离。然而，对于任意点，没有超椭球表面上对应的最近点的解析解。因此，我们用近似的点到曲面度量来代替。0其中 S = { s j ∈ S θ | j = 1 , 2 , ..., M } 是一组点0† 不存在严格和理论上的等距采样方法。这里我们指出一种实际的近似等距采样方法。26810在超椭球表面 S θ上密集均匀采样（在合成实验中间隔为0.02）。0图4. 部分数据恢复结果。 (a) 平均误差（基线初始化3次）。 (b)平均误差（基线初始化1次）。 (c) 剔除实验。 (d) 平均运行时间。(e) 全局最优率（当拟合误差小于0.01时宣布） (f)部分比例为0.4时的示例，基线陷入局部最优，而我们的方法成功跳出。0部分数据恢复：该实验模拟了只能从超椭球的部分区域采样点的情况，因为有时我们只能获得对象的部分视图。对于500个超椭球的每个点云，随机选择一个点，并保留与随机点最近的一定百分比（部分比例）的点。我们在5个不同的部分比例级别上进行测试，从1.0（完整点云）到0.2，总共得到2500个点云。结果如图4所示。我们的方法在所有部分比例级别上都明显优于基准方法。当完整的超椭球点云可用时，所有方法都表现良好。然而，随着部分比例的降低，越来越难以对参数进行合理的初始猜测。因此，基准方法更容易陷入局部最优，即使进行多次尝试也是如此。而我们的方法通过几何引导的切换策略持续避免局部最优，从而保持了较高的全局最优收敛成功率。我们还对S-step进行了消融研究。结果验证了其有效性（图4(c)）。尽管我们的算法只能保证局部最优性，但是0实证结果表明，我们的方法在实践中很可能实现全局最优解（图4（e））。对异常值的鲁棒性：我们向2500个点云添加不同水平的高斯异常值。异常值比率（异常值的数量/内点的数量）用于量化异常值的程度。结果如图5所示。我们的方法对异常值具有较强的鲁棒性，能够从严重损坏的点云中恢复出潜在的超椭球。Implicit-LSQ、Radial-LSQ和NumericalStable对异常值很敏感，因为它们不具备容忍异常值的设计。Robust-fitting的表现更好，但受到其启发式异常值拒绝策略的限制，该策略对干净的点云也会产生不良影响。相比之下，我们的方法采用后验概率方法推断异常值，因此在各种异常值水平下保持高鲁棒性。0图5.异常值结果。（a）不同异常值比率下的平均误差。（b）平均运行时间。Radial、Implicit和NS的运行时间没有显著意义，因为它们在大多数情况下无法正确恢复超椭球。（c）异常值比率为0.4时的示例。0对噪声的鲁棒性：在这个实验中，我们使用不同方差的高斯噪声破坏点云中的每个点。结果如图6所示。可以观察到，随着噪声水平的增加，所有方法（包括我们的方法）的拟合误差都会增加。这是因为与异常值不同，噪声本质上破坏了几何信息。但是，我们的方法在处理噪声点云时显示出优势和效率。04.2. 在真实数据集上的恢复0在本节中，我们评估了两个公共数据集上的单个超椭球恢复：KIT ObjectModel [14]和BigBIRD[30]。这两个数据集都包含各种日常家庭物品，并被广泛用作基准。26820图6.噪声结果。（a）不同噪声水平下的平均误差（在未受损的点云上评估）。（b）平均运行时间。（c）高斯噪声水平为0.01的示例。0在三维物体重建、识别和机器人抓取方面，我们使用高精度激光扫描仪（MinoltaVI-900）对KIT进行扫描，而使用商业级RGB-D相机（PrimeSense Carmine 1.08）对BigBIRD进行捕捉。KITObjectModels：我们遵循[35]中的设置。该数据集包括145个物体，其中[35]选择了105个可以通过单个超椭球合理近似的物体。然而，我们决定将范围缩小到97个物体，因为一些物体（例如瓶子）可以通过多个超椭球更好地恢复。因此，我们将这些情况的讨论推迟到第4.3节。我们使用体素化网格对点云进行采样，大约得到1500个点。定量结果如图7（c）所示。我们的方法在准确性和效率方面优于所有基线方法。我们的方法还展示了一些无法以定量方式显示的有趣特征。如图7（a）所示，一些物体具有轻微的局部变形和/或与主要结构偏离的部分，这会影响主要形状的捕捉。我们的概率方法能够减少这些部分（被推断为异常值）的影响，并实现整体更好的拟合。此外，在图7（b）中，盒状物体通常内部填充有内容，导致形状在中间略微延伸。这种形状属于超椭球的词汇范围内，但与长方体非常接近，其他算法无法区分它们，即陷入局部最优解。相比之下，我们的方法能够在类似形状之间切换和检查，并恢复最佳的超椭球。BigBIRD：与激光扫描仪相比，低成本的RGB-D相机在测量精度上劣于，导致点云中存在噪声和异常值。因此，BigBIRD是评估算法在日常操作中鲁棒性的理想数据集。该数据集包含125个物体实例，我们对其中91个物体进行了测试，这些物体可以通过单个超椭球合理近似。0图7. KIT结果。(a)和(b)是Radial-LSQ和所提出方法之间拟合结果的两个横截面视图。(c) 平均误差(Eq.(12)，采样间隔为0.1毫米)和运行时间的定量结果。0图8. BigBIRD结果。(a)显示恢复的超椭球与原始点云之间的局部拟合误差的热图。(b)平均误差(Eq. (12)，采样间隔为0.1毫米)和运行时间的定量结果。0点云经过体素化网格下采样到约1000个点。结果如图8所示。在基线方法中，Robust-fitting表现出更好的鲁棒性，但收敛时间更长。我们的方法能够以最少的时间消耗实现最佳的准确性。04.3. 多超椭球恢复0在本节中，我们展示了我们对多超椭球恢复的扩展的定性结果(Sec.3.6)。我们使用KITObject-Models中无法通过单个超椭球适当近似的复杂对象。我们将点云下采样到约5000个点，以保留足够的复杂形状细节。我们将最大分层层数设置为3，修剪阈值设置为60个点。如图10所示，基线单个超椭球方法无法捕捉到瓶子的主要超椭球状部分(圆柱体)。我们的方法成功地做到了这一点，并将瓶子盖周围的点标识为异常值，从而对瓶子进行了分层恢复。图9展示了更复杂对象的其他结果。我们的方法能够用超椭球生动地表示对象。一些动物的耳朵和嘴等细节部分也可以恢复。ing threshold to 60 points. As shown in Fig. 10, the base-line single superquadric method fails in capturing the majorsuperquadric-like part of a bottle as a cylinder. Our methodsucceeds in doing this and identifies the points around thecap of the bottle as outliers, from which the bottle is recov-ered hierarchically. Other results on more complex objectsare shown in Fig. 9. Our method is able to represent the ob-jects vividly with superquadrics. Some detailed parts suchas ears and mouths of animals can also be recovered.26830图9. 多超椭球恢复的示例。(a) 原始点云。(b) 使用所提出方法恢复的多超椭球表示。(c) 基于多超椭球表示的原始点云分割。0图10. KIT上瓶子的定性多超椭球恢复。(a)Radial-LSQ和EMS(我们的方法)之间单个超椭球恢复的比较。所提出的方法能够从点云中恢复出主要的超椭球形状(一个圆柱体)。(b)所提出方法的其他结果。05. 讨论与限制0各种实验证明我们的方法是稳健、准确和高效的。如第4.1节和第4.2节所示，基线方法对初始化非常敏感，很容易陷入局部最优解。因此，为了获得满意的结果，它们通常需要从不同的初始猜测开始进行多次尝试。相比之下，我们的方法能够即时避免局部最优解，并且一次性实现更好的恢复精度。此外，我们的方法对异常值和噪声具有鲁棒性。这一特性是通过我们对问题的概率建模引入的，我们明确地对其进行了建模。0我们的方法通过均匀分布和高斯分布分别对异常值和噪声的可能来源进行建模。这一特性也为我们的多超椭球扩展奠定了基础。如第4.3节所示，我们的方法能够从点云中捕捉到主要的超椭球状部分，并从上一层识别到的'异常值'中分层生成从属超椭球。然而，我们的多超椭球扩展存在局限性：我们的方法要求被恢复的对象具有固有的分层几何结构。对于更一般的情况，更倾向于进行初步的点云分割[25,26]。另一个限制是由于超椭球的表达能力。很难很好地捕捉到薄壁非凸物体(如杯子)的形状。在未来的工作中，我们计划通过适应变形和基本形状减法来扩展超椭球的词汇。06. 结论0我们提出了第一个从点云中恢复超椭球的概率方法.我们将恢复过程形式化为MLE问题，并提出了一种新颖的几何引导方法EMS来推断最优超椭球.所提出的方法在准确性、鲁棒性和效率方面优于现有技术，这得到了对合成和真实数据集进行的大量实验证明.我们还将我们的方法扩展到使用超椭球层次结构表示复杂对象.这种表示可以揭示对象的几何和层次结构，我们相信在促进对象分类、分割和抓取等任务方面具有巨大潜力.0致谢本研究得到新加坡国家研究基金会的支持，属于其中型中心计划-先进机器人技术创新中心（CARTIN）R-261-521-002-592，以及JHU内部资金.26840参考文献0[1]R.Bajcsy和F.Solina.三维物体表示再探讨.在《IEEE/CVF国际计算机视觉会议（ICCV）论文集》中，页231-240，1987年. 1 , 20[2]A.H.Barr.超椭球和角度保持变换.《IEEE计算机图形与应用》，1(1):11-23，1981年. 20[3]I.Biederman.成分识别：人类图像理解的一种理论.《心理评论》，94(2):115，1987年. 10[4]G.Biegelbauer和M.Vincze.通过将超椭球拟合到距离图像数据中实现高效的3D物体检测，用于机器人的物体操作.在《2007年IEEE国际机器人与自动化大会（ICRA）论文集》中，页1086-1091，2007年. 10[5]D.L.Borges和R.B.Fisher.基于类别的用体积基元表示的3D物体识别.《图像与视觉计算》，15(8):655-664，1997年.英国机器视觉会议. 1 , 20[6]L.Chevalier，J.Jaillet和A.Baskurt.3D对象的分割和超椭球建模.在《第11届中欧计算机图形学、可视化和计算机视觉国际会议，WSCG 2003》中，2003年. 1 , 20[7]T.F.Coleman和Y.Li.关于具有界约束的大规模非线性最小化问题的反射牛顿方法的收敛性.《数学规划》，67:189-224，1994年10月. 40[8]T.F.Coleman和Y.Li.一种用于具有界约束的非线性最小化问题的内部信任域方法.《SIAM优化学报》，6(2):418-445，1996年. 40[9] B. Curless和M.Levoy.一种从距离图像构建复杂模型的体积方法.在《计算机图形学和交互技术第23届年会论文集》中，SIGGRAPH'96，页303-312，纽约，纽约，美国，1996年.计算机协会. 10[10]A.P.Dempster，N.M.Laird和D.B.Rubin.通过EM算法从不完全数据中获得最大似然估计.《皇家统计学会：B系列（方法论）杂志》，39(1):1-22，1977年. 2 , 30[11] H. Fan，H.Su和L.J.Guibas.用于从单个图像重建3D物体的点集生成网络.在《计算机视觉和模式识别（CVPR）IEEE会议论文集》中，2017年7月. 10[12]A.D.Gross和T.E.Boult.用于恢复参数化固体的拟合误差度量.在《IEEE/CVF国际计算机视觉会议（ICCV）论文集》中，页690-694，1988年. 1 , 2 , 3 , 50[13] Y.Hu和W.G.Wee.使用可变形超椭球模型从距离图像中提取鲁棒的3D零件.在《信号处理、传感器融合和目标识别IV》中，卷2484，页524-535.国际光学和光子学学会，SPIE，1995年. 2 , 50[14] A. Kasper，Z. Xue和R.Dillmann。KIT对象模型数据库：用于服务机器人中的对象识别、定位和操作的对象模型数据库。 The0国际机器人研究杂志，31(8)：927-934，2012年。 1 , 60[15] D. K. Katherine和S. S.Elizabeth。人类认知中的核心系统。在《从行动到认知》中，进展脑科学研究的第164卷，页码257-264。Elsevier，2007年。 10[16] A. Leonardis，A. Jaklic和F.Solina。用于分割和建模范围数据的超椭球体。IEEE模式分析与机器智能交易，19(11)：1289-1295，1997年。 1 , 20[17] K.Levenberg。一种解决最小二乘法中某些非线性问题的方法。应用数学季刊，2(2)：164-168，1944年。 20[18] W

下载后可阅读完整内容，剩余1页未读，立即下载