FSSOM-MPR算法:提升视频对象编码性能

需积分: 8 0 下载量 182 浏览量 更新于2024-08-12 收藏 3.42MB PDF 举报
"黎洪松,许保华. 一种基于运动模式识别的视频对象编码算法[J]. 北京师范大学信息科学与技术学院, 北京100875, 2007: 0074-04." 在视频编码领域,块匹配运动估计补偿(ME+MC)算法是广泛采用的技术,但其存在一些不足,如块效应、运动边界不清晰等问题。针对这些问题,2007年的一篇论文提出了基于自组织特征映射(Self-Organizing Feature Map, SOM)的运动模式识别(Motion Pattern Recognition, MPR)算法,该算法专用于会议电视的视频对象编码。 SOM是一种无监督学习的神经网络模型,能够自动地将输入数据组织成层次结构,对于运动模式的识别有着独特的优势。论文中,作者黎洪松和许保华为提升SOM算法的性能,进一步发展了频率敏感自组织特征映射(Frequency Sensitive Self-Organizing Feature Map, FSSOM)算法。FSSOM在SOM的基础上考虑了频率特性,增强了对运动模式的识别精度,从而在处理复杂运动场景时能更准确地捕捉物体的运动轨迹。 实验结果显示,FSSOM-MPR算法相比于传统的ME+MC算法在编码性能上有显著提升。在压缩比达到180:1的情况下,使用FSSOM-MPR算法编码后的重建视频图像的平均峰值信噪比(Peak Signal-to-Noise Ratio, PSNR)提高了3.3dB。这是一个重要的指标,因为它直接关系到视频质量,PSNR的增加意味着图像的清晰度和细节恢复得更好,视觉效果更佳。 关键词包括运动估计补偿、模式识别、自组织特征映射以及视频对象编码,这些都揭示了研究的核心内容。文章的中图分类号“TP183”和“TN919.8”分别对应于计算机科学技术和通信技术领域的分类,文献标识码“A”则表示这是一篇应用科学研究论文。 这篇论文提供了一种创新的视频编码策略,通过结合SOM和FSSOM技术改进了运动估计和补偿的过程,对于提高视频压缩效率和图像质量具有重要意义,特别是在会议电视等实时视频传输场景下。这项工作对于理解视频编码原理和优化现有编码算法有着积极的指导作用。