SegStereo：融合语义信息提升视差估计精度

56 浏览量更新于2024-06-20 收藏 1.95MB PDF 举报

"SegStereo：利用语义信息进行视差估计"是一篇关于深度学习在计算机视觉领域的创新研究论文。该工作着重于解决双目立体图像的视差估计问题，这是一个关键任务，对于深度感知、场景理解和自动驾驶等应用至关重要。传统的视差估计算法在缺乏明显特征的区域可能会失效，因此，作者提出了一种新的方法，即通过整合语义线索来提升预测精度。文章的核心思想是引入语义特征嵌入和规范的语义线索作为损失项，将其纳入主流的视差估计框架中。SegStereo模型特别设计为统一架构，它利用分割出的语义特征，并采用了语义softmax损失函数，这种损失函数有助于增强模型对视差图的预测能力。有趣的是，这种方法在无监督和有监督的学习环境下都能展现出良好的效果，表明了语义信息的有效通用性。论文展示了在KITTI Stereo基准测试中的优秀表现，这表明SegStereo不仅在标准评估中取得了最先进的成绩，还在CityScapes和FlyingThings3D数据集上展示了稳定的预测性能。在具体例子中，如图1所示，与仅凭图像本身的无监督模型相比，SegStereo在模糊或特征稀疏区域的视差估计上显著更为精确，证明了语义线索在优化视差估计方面的关键作用。 SegStereo代表了深度学习与语义理解相结合的创新策略，通过有效利用上下文信息，显著提高了立体图像视差估计的准确性，为相关领域的研究和实践提供了新的解决方案。关键词包括视差估计、语义线索、语义特征嵌入以及softmax损失正则化，这些都是理解此研究的重要术语。

G. Yang，H. Zhao，J. Shi，Z. Deng和J.

贾

通过金字塔立体匹配网络找到对应关系。相比之下，我们的方法集中

在结合语义信息，以提高语义特征嵌入的视差估计。

无监督立体匹配

近年来，提出了许多基于空间变换的无监督学习方

法，用于视点合成、深度预测、光流和视差估计等。无监督方法摆脱

了对地面实况标签的依赖，而地面实况标签的访问总是昂贵的。

Flynn等人[12]提出了一种名为DeepStereo的图像合成网络，该网络学

习与单独的条件颜色模型相结合的成本量Xie等人[40]设计了一个

Deep3D网络，可以最大限度地减少像素重建损失以生成右视图图

像。

Garg等人[13]提出了一种端到端框架，通过优化校准立体环境中的

投影误差来学习单视图改进的方法[17]引入了一个完全可微的结构和

一个额外的左右一致性检查，从而得到更好的结果。Kuznietsov

等人

提出了一种半监督方法。[27]其中使用监督和非监督Yu等人[23]专注

于通过光度恒定性和运动平滑性的光流的无监督学习。Meister等人

[32]定义了双向普查损失来训练光流。一个迭代的无监督学习网络提

出的周

等

。[45]采用左右检查来挑选合适的匹配对。与这些无监督的

方法相比，我们的模型将翘曲重建应用于光度图像和语义图，以及附

加的语义特征嵌入，以可靠地估计视差。

与视差估计相比，语义分割是一项高级分类任务，其中图像中的每个像

素都被分配到一个类[29，39，7，44]。有几种方法将场景解析信息应用

于其他任务。Guney和Geiger [18]利用MRF公式中的对象知识来解决立体

模糊。Bai等人[2]解决了实例级分割和极线约束，以减少光流估计的不确

定性。Ren

等人

的级联分类框架。[35]迭代地细化语义掩模、立体对应和

光流场。Behl等人[4]将实例识别线索集成到基于CRF的场景流估计模型

中。

与我们的动机相似，Cheng

et al

. [9]设计了一个名为SegFlow的端到

端可训练网络，它可以实现视频对象分割和光流的联合学习。该模型

包含分割分支和流分支，其特征图连接。我们以不同的方式关注

disparity估计，其中场景中的对象被同时捕获，因此稳定的结构信息

可以被利用。此外，我们的

SegStereo

模型还通过扭曲将softmax损失传

播回视差分支，这使得语义信息在整个训练过程中有效此外，我们的

模型使无监督学习的差距与光度损失和语义感知的约束。

剩余15页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

SegStereo：融合语义信息提升视差估计精度

利用语义信息提升视差估计的SegStereo方法

多视点视频编码新方法：矢量估计与加权视差插值

双目标定技术：计算深度与生成视差图

parallax-scrolling::seedling:SpriteKit 视差滚动示例

parallax-page-demo::page_facing_up::pager:演示视差

Parallax-Website:该项目旨在利用视差效果

parallax:响应式 6 页视差模板

xparallaxjs:X轴上的视差效应

parallaxification:只是另一个视差库

视差：Utilizando esse maravilhoso efeito视差com HTML e CSS。 :sheaf_of_rice:

最新资源