无监督多帧光流估计与遮挡处理的深度学习方法

无监督学习

123 浏览量更新于2024-06-20 收藏 1.45MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

"本文主要探讨了无监督多帧光流估计和遮挡处理的方法，针对当前无监督光流学习存在的局限性，特别是遮挡处理的挑战。作者提出了一种利用三帧配置的框架，增强光度损失并明确处理遮挡问题。通过实验，这种方法展示出优于现有无监督两帧方法的性能，甚至可以与部分监督方法相媲美。光流估计是计算机视觉中的核心任务，而深度学习在此领域的应用面临训练数据获取困难，尤其是真实的光流标注数据。为了解决这个问题，许多方法依赖于合成数据进行训练，但这可能导致模型在真实场景上的表现不佳。文章通过实例展示了无监督光流估计在遮挡情况下的困难，并提出了相应的解决方案。" 无监督学习光流方法通常依赖于对连续帧之间的像素运动的无标签数据，但由于遮挡的存在，这种估计变得复杂。传统的光流算法基于局部平滑假设和变分优化，但这些方法在处理复杂运动和遮挡时效果有限。随着深度学习的发展，端到端的网络可以学习更复杂的流表示，然而，训练这些模型需要大量带有精确标注的训练数据，这是实际操作中的一个主要障碍。本文提出的框架着重于多帧设置，尤其是三帧配置，以此来更好地处理遮挡问题。通过这种方式，网络能够利用更多的上下文信息来推断被遮挡像素的运动，从而提高光流估计的准确性。实验结果显示，这种方法不仅在无监督设置下表现出色，而且在某些情况下可以与需要监督学习的方法相竞争，这对于无监督学习领域是一个重要的进步。此外，论文还讨论了合成数据与真实世界数据之间的差距，以及这对光流估计的影响。虽然合成数据易于生成且可以提供大量的训练样本，但它们可能无法完全捕捉到现实世界的复杂性和多样性，尤其是在遮挡和光照变化等方面。因此，开发能够在无监督环境中有效处理遮挡的算法对于提高光流估计的泛化能力至关重要。这篇论文贡献了一个创新的无监督多帧光流学习框架，它有效地解决了遮挡问题，提升了光流估计的精度，为无监督学习在计算机视觉领域的应用开辟了新的可能性。这一方法不仅对学术研究有价值，也为实际应用如自动驾驶、视频分析等提供了实用的工具。

资源详情

资源推荐

J. Janai

，

F.Guéney

，

A.Ranjan

，

M.Black

和

盖革

在本文中，我们建立在PWC-Net上，因为他们的框架是轻量级的，产生最先

进的结果，并允许我们的多帧公式的优雅集成。除了光流，我们的模型还考虑

了遮挡。与完全监督设置[8- 11 ]相比，我们在没有地面实况流的情况下训练我

们的

无监督学习：深度神经网络对大型注释数据集的依赖性最近推动了无监督学习

技术的发展。已经针对单个图像深度预测[16，36-39]、在典型的无监督光流框

架中，光度损失与无纹理区域的平滑度损失结合使用[15更具体地，目标图像根

据预测的流量被扭曲，并且使用光度损失与参考图像进行比较。通常，使用编

码器-解码器网络[15，17-20]

。

Patr auceanetal. [17]

将简单的编码器

解码器网络与

卷积LSTM相结合，以合并来自先前帧的信息。我们还在多个帧上使用光度损

失，但不是使用LSTM，我们修改了[11]中提出的网络架构，以在三个帧上使用

恒定速度假设直接编码时间关系

最近，[19，20]提出从光度损失中排除遮挡区域，以避免误导信息。虽然他

们两人共同学习的向前和向后流动，梅斯特等人。[20]使用前向-后向一致性检

查和Wang et al. [19]用反向流创建范围图，对参考帧中每个像素的对应性进行然

而，这两种方法都使用启发式算法来获得最终的遮挡图。而不是使用一个启发

式，我们估计的遮挡图联合光流。我们将流量和遮挡估计与我们的光度损失相

关，通过根据遮挡估计对来自未来和过去的信息进行加权。这种联合公式使我

们能够从头开始训练我们的遮挡感知模型，而[20]则需要在没有遮挡推理的情

况下进行预训练。另一项关于深度和自我运动的无监督学习的最新工作[39]使

用光度损失函数预测可解释性掩模以排除动态对象和遮挡。虽然[39]仅解决静

态场景，但我们针对一般的无约束光流问题，并学习在此设置中联合预测流动

和遮挡区域

方法

在本文中，我们提出了一种利用多帧进行光流和遮挡的无监督学习的方法在光

流的无监督学习中，只有光度损失提供指导。光度损失根据流量估计扭曲目标

帧，并将扭曲的目标帧与参考帧进行比较。由无纹理区域引起的局部模糊性用

在相邻像素之间传播信息的附加空间平滑度约束来处理。然而，由于由非朗伯

反射、遮挡、大运动和照明变化引起的模糊，以无监督方式学习光流是复杂的

考虑多个帧可以帮助解决一些模糊性，特别是由遮挡引起的模糊性因此，我们

提出了一种多帧公式来训练卷积神经网络，以联合预测流场和遮挡

剩余16页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

无监督多帧光流估计与遮挡处理的深度学习方法

使用dlib进行稀疏光流跟踪人脸，第一帧检测人脸，其余帧追踪第一帧检测的人脸

光流跟踪技术进行目标识别 项目源码 python实现

光流法检测车辆轨迹c++

将这个视频进行光流法追踪

光流法运动目标检测matlab算法

lk 光流法 matlab代码

VINS-Fusion中的流光追踪法和LK光流法是同一种技术吗

ViBe算法和光流法的优缺点和区别

太密集的纹理会影响光流数据吗

【Matlab】运动目标检测之“光流法”

目标跟踪模板匹配法、TLD与光流法区别

光流法的相位提取c++

卡尔曼滤波+LK光流法跟踪算法

boundingbox作为optical flow光流输入

deepflow光流法原理

基于背景建模的遮挡检测方法

java中解决元素层级被遮挡的方法

自监督 半监督 无监督

实现一种运动补偿算法

shapecontext能处理遮挡吗

最新资源

光流跟踪技术进行目标识别项目源码 python实现

自监督半监督无监督