三维视觉:凸松弛与非最小问题的通用求解器

0 下载量 2 浏览量 更新于2025-01-16 收藏 808KB PDF 举报
"三维视觉中的凸松弛与非最小问题" 在三维视觉领域,解决一致性问题和处理非最小问题至关重要。本文由Thomas Probst等人撰写,来自苏黎世联邦理工学院的计算机视觉实验室,探讨了一种通用的非最小求解器,该求解器基于计算代数几何中的多项式优化问题(POP)理论。作者采用了肖尔或拉塞尔的放松方法,这些方法在理论上有坚实的根基,并被应用于解决3D视觉中的共识最大化问题。 论文的核心贡献在于,它提供了一个通用的框架,将现有的数值计算代数理论应用于3D视觉问题,如刚体变换估计、非刚性结构从运动恢复(NRSfM)和相机自动校准。这个框架不仅解决了最小化问题,还能够处理非最小化和共识最大化问题,而且在各种应用中都展示了与先进方法竞争的能力。 传统的3D视觉任务通常分为内点检测和模型计算两部分。内点检测通过最大化测量的一致性来识别与模型参数匹配的测量值(即内点)。最小化方法常用于从有限的测量中估计模型参数,但这种方法在处理噪声和异常值时可能不够稳定。因此,共识最大化作为替代方案受到了广泛关注,尤其是那些寻求全局最优解的凸模型方法。 尽管共识最大化问题已被证明为NP难问题,但采用凸模型表示的方法已经能够在速度和最优性上取得良好的效果。然而,对于非凸模型,现有方法通常需要添加额外的凸约束来近似求解。本文提出的方法则通过凸松弛提供了一种更为通用的处理非凸问题的途径,从而能够在不确定性和非凸性共存的环境中找到更可靠的解决方案。 实验部分,作者在刚体变换、NRSfM和相机自校准等不同问题上验证了他们的方法,结果表明,提出的非最小化和共识最大化的解决方案既与理论分析一致,也与最先进的技术相媲美。这为3D视觉中的放松方法提供了新的理解,并为未来的研究开辟了道路,特别是在处理复杂和非凸模型的优化问题时。