基于机器学习与生物模型的V1-MT序列光流估计算法提升视频运动感知性能

0 下载量 126 浏览量 更新于2024-08-28 收藏 735KB PDF 举报
本文探讨了"序列图像运动自适应V1-MT光流估计算法",这是一种创新的计算机视觉技术,旨在解决传统光流估计算法在应对光照变化、大位移场景以及异质点去除等问题上的局限性。该方法深受人类视觉认知机制的启发,结合机器学习和生物模型,特别强调了V1(初级视觉皮层)和MT(中间层)细胞模型在运动感知中的作用。 首先,作者引入了基于ROF模型的结构纹理分解(Structure-Texture Decomposition,STD)技术,通过有效地分离图像中的结构和纹理信息,成功地减轻了光照和色彩变化对光流估计的影响。这种技术模仿了人眼在不同光照条件下的视觉适应性,提高了算法的鲁棒性。 接着,文章提出利用多V1细胞的加权组合,这些细胞模拟了MT细胞的行为,通过非线性正则化进一步增强了对目标运动速度的感知能力。作者采用了岭回归训练策略,使得算法能够自适应地调整权重,以更精确地捕捉目标的运动轨迹。 最后,为了处理大位移视频序列,作者引入了由粗到精的增强方法和图像金字塔的局部运动估计采样策略,这样可以确保在处理大规模空间移动时,算法依然保持高效且准确。通过理论分析和实际测试,结果证实了新方法在适应各种视频场景下,能够展现出高度的通用性、有效性以及鲁棒性,更好地模拟人眼对视觉信息的处理方式。 关键词包括光流、V1、MT、时空滤波器、运动感知和岭回归,这些概念共同构成了文章的核心研究内容。该研究的工作发表在《工程科学学报》(Chinese Journal of Engineering)上,2017年第39卷第8期,1238-1243页,DOI:10.13374/j.issn2095-9389.2017.08.014,为计算机视觉领域的研究者提供了一个有前景的新方法。作者们来自空军工程大学航空航天工程学院和陕西服装工程学院,李帅是通讯作者,其联系方式可以通过邮件lishuailisuai@163.com获取。