视频运动先验在人体分割优化中的应用

0 下载量 160 浏览量 更新于2024-06-20 收藏 1.66MB PDF 举报
“视频运动先验优化的人体分割” 本文探讨了如何利用视频中的运动先验信息来改进人体分割技术,特别是在面对现实世界中的数据分布不匹配问题时。传统的深度学习语义分割方法在处理监控摄像头等复杂环境时,由于光照、视角、天气等因素导致的性能下降。为了解决这个问题,研究者提出了一种“改进的主动学习”方法。 该方法的核心是利用视频中的光流信息来提取运动先验,这些运动先验可能对应于人体的运动部分。通过记忆网络的策略模型,可以再学习并选择出具有高精度的运动先验(称为强运动先验),这些选定的段被用于模型的微调,从而提高人体分割的准确性。这种方法特别适用于跨多个场景和模态的分割任务,如从RGB视频到红外(IR)视频的转换。 论文中提到,主动学习策略是解决数据点选择问题的关键。主动学习允许模型选择最具代表性和最有价值的数据点进行标注,以最小的成本获取最大的性能提升。在监控摄像头数据集和公开的UrbanStreet数据集上,该方法显示出显著的性能提升。 图1展示了从视频中提取的RGB块及其对应的基于块的运动先验,分为不良和良好两类。通过主动学习策略,可以挑选出有助于提高跨模态分割性能的良好运动先验。 这项工作强调了视频中的运动信息在人体分割中的潜力,并提出了一种有效的主动学习策略,以克服现实世界中计算机视觉应用的挑战。它不仅为人体分割提供了新的解决方案,而且可以作为现有域自适应方法的补充,进一步提高模型的泛化能力。