图像视频编码算法优化与性能提升

需积分: 9 6 下载量 195 浏览量 更新于2024-08-01 收藏 3.77MB PDF 举报
本论文深入探讨了图像和视频编码领域的多个算法创新。作者刘剑秋在北京交通大学攻读博士学位,专业为信号与信息处理,其导师为阮秋琦。论文的主题聚焦在如何在现有技术基础上提升图像和视频编码的性能,尤其是在压缩效率和编码比特流的灵活性上。 首先,论文在第二章提出了小波精细可伸缩图像编码算法。该算法的特点在于将编码比特流分为基本层和增强层。基本层虽然牺牲了一定的可伸缩性,但能提供更高的压缩效率,适合那些对清晰度要求较高的场景。增强层采用嵌入式编码,确保在任意截断点都能正确解码。通过小波变换和量化编码策略,低频子带系数独立编码,而高频子带按小波块进行分块处理,随后利用位平面扫描编码方法对差值信息进行编码。这种设计兼顾了压缩性能和可伸缩性,实验结果显示在相同比特率下,该算法能优于JPEG-2000和SPIHT算法在图像质量上。 在第三章,作者提出了小波低频预测图像编码算法。利用小波变换的能量集中在低频子带的特性,算法采用低频子带预测的方式,通过重建模糊图像对原始图像进行编码,再对差值图像采用自适应分块变换编码。通过拉格朗日乘数法寻找最佳变换块尺寸,以平衡编码比特数和重建质量。结果显示,这种编码方法在压缩效率和重建图像主观质量上超越了SPIHT和JPEG-2000。 最后,在第四章,针对低比特率头肩像视频编码的挑战,作者开发了一种脸部区域增强算法。在低比特率环境下,关键在于优化关键区域(如人脸)的编码。论文首先介绍了基于肤色特征的人脸区域定位和跟踪算法,确保在视频序列中快速且精确地定位人脸。其次,通过对JM算法的筒化和优化编程,对人脸区域进行精细的量化和编码,从而在有限的比特率下显著提升重建视频的主观质量。 总体来说,刘剑秋的论文深入探究了图像和视频编码的前沿技术,特别是通过小波变换、预测编码和智能区域处理等方法,实现了在压缩效率、编码灵活性和特定应用场景下的优化,展示了作者在图像和视频编码领域的深厚理论功底和实践能力。