"屏幕图像编码是当前云计算背景下的一个重要研究领域,涉及到如何有效地压缩和传输屏幕内容,如电子文档、网页和应用程序界面等。传统的视频压缩算法在处理这类数据时往往表现不佳,因为屏幕内容通常包含大量的文本和图形,其结构和特征与自然视频有很大的不同。为此,研究人员提出了一种新的编码方法,即误差限自适应的有损字典编码方案,该方案结合了全色度High Efficiency Video Coding (HEVC)标准,形成了LDSC(Lossy Dual-coder Single Chroma-sampling-rate)算法。
LDSC算法的核心是能够根据屏幕内容的不同区域类型选择最佳的编码策略。它通过分析不同区域的率失真性能,自适应地将更合适的编码结果纳入码流,以提高编码效率。为了评估有损字典编码的效果,研究者引入了一个基于匹配长度和匹配失真的评估模型——LD-Cost模型,该模型利用拉格朗日乘子法进行分析和计算,以量化编码过程中的质量和效率。
针对有损字典编码可能导致的误差积累问题,LDSC算法提供了相应的解决策略,以减少错误传播对图像质量的影响。实验结果显示,相比于基于无损字典编码的双编码器方案,LDSC算法在不牺牲主观图像质量的前提下,显著提升了编码性能。特别是在连续色调内容丰富的屏幕视频中,其编码适应性表现优秀。在全I帧配置下,相对于无损字典编码,LDSC实现了3%至15%的BD-rate提升;与仅使用HEVC相比,这一提升达到了7%至49%,这表明了LDSC在编码效率上的显著优势。
关键词:高效视频编码;LD-Cost;屏幕图像编码;有损字典编码。"
这篇论文的研究工作是在国家自然科学基金、上海市自然科学基金以及中央高校基本科研业务费专项资金的支持下完成的,由来自同济大学超大规模集成电路研究所的张培君、金小娟、王淑慧、周开伦和林涛共同完成。林涛教授作为长江学者,其研究方向主要集中在多媒体算法和SoC(System on Chip)设计,而其他作者则在视频编解码和多媒体算法设计等领域有所专长。