基于图像相关性和概率统计的视频编码帧内预测优化

1 下载量 107 浏览量 更新于2024-08-29 1 收藏 1.82MB PDF 举报
本文主要探讨了新一代视频编码系统中帧内预测模式选择的优化问题,目标是通过降低复杂度来提升编码效率。作者首先回顾了HEVC(High Efficiency Video Coding)视频编码标准中的三种主要帧内预测模式:Angular预测模式、Planar预测模式和LM预测模式。这些模式在编码过程中用于估计当前像素的值,从而减少所需的数据量。帧内率失真代价最优化(Rate Distortion Optimization, RDO)是一个关键步骤,通过计算不同预测模式下的预测误差和编码复杂度,以确定最合适的预测模式。 文章引入了两个代价函数,即绝对误差和结构相似度(Structural Similarity Index Measure, SSIM),用于处理预测残差,从而初步筛选出可能的最佳候选预测模式。接着,作者提出了一种简化的方法,结合简化率失真代价模型和最有可能预测模式(MPM),进一步确定RDO候选预测模式。通过这种方法,能够找到更优的预测模式,从而在保持或稍有牺牲图像质量(PSNR,Peak Signal-to-Noise Ratio,量化了图像质量)的前提下,显著减少编码时间和提高压缩效率。 在HEVC测试模型HM4.0的平台上,作者实施了优化算法,并使用不同分辨率的视频序列进行了实验。实验结果显示,在不影响PSNR(平均降低0.06dB)的条件下,优化的帧内预测编码方法能分别平均减少30.18%的压缩时间和1.97%的码率,同时相较于文献[20]中的帧内预测编码方法,复杂度减少了11.45%,码率减少了0.46%,而PSNR有所提升0.01dB。这意味着优化算法在压缩性能上整体优于文献中的方法。 本文的贡献在于提供了一种有效且低复杂度的帧内预测模式选择策略,能够在保证视频质量的同时,显著提升视频编码的效率。这对于现代视频编码技术的发展具有实际意义,特别是在实时视频传输和大规模视频存储应用中,这种优化算法的实用性尤为突出。