四元傅里叶变换在显著性检测及低码率视频编码中的应用

需积分: 25 3 下载量 116 浏览量 更新于2024-09-08 收藏 736KB PDF 举报
"本文主要探讨了一种基于改进四元傅里叶变换的视觉显著性检测方法,并将其应用于视频编码,旨在解决低码率编码条件下视频压缩的人工痕迹问题。该方法利用人眼视觉注意力权重矩阵对图像的亮度、色度和运动特征组成的四元数进行加权,通过四元傅里叶变换获取图像的视觉显著图。结合中心凹恰可觉察失真(FJND)模型,该方法在基于感兴趣区域的视频编码中可以提升编码质量。实验结果显示,提出的算法在显著性检测的精度上优于其他流行算法,并在低码率视频编码的主观质量方面表现出优越性。" 本文是关于计算机视觉和视频编码技术的研究,具体关注的是如何改善有损视频压缩在低码率条件下的编码效果。传统的基于感兴趣区域的视频编码在低码率下可能会导致明显的编码失真,影响观看体验。为了解决这一问题,研究者提出了一种创新的方法,即基于注意力权重矩阵的四元傅里叶变换的视觉显著性视频编码模型。 首先,该方法引入了人眼视觉注意力权重矩阵,这个矩阵能够根据人眼对不同图像区域的敏感程度对图像的四元数特征进行加权。四元数是一种数学概念,它结合了图像的亮度、色度和运动信息,形成一个全面的特征表示。通过四元傅里叶变换,可以从这些四元数特征中提取出图像的视觉显著图,这有助于识别图像中的重要区域。 然后,利用中心凹恰可觉察失真(FJND)模型,该模型模拟人眼对图像失真的感知能力,特别是在图像中心区域的敏感度。将这一模型与四元傅里叶变换相结合,可以更精确地确定哪些区域需要更高的编码质量,从而在保持低码率的同时,减少编码人工痕迹,提高视频编码的质量。 实验部分,研究者将提出的算法与五种流行显著性检测算法在两个大型的眼动跟踪数据库上进行了对比,结果显示,新算法在显著性检测的准确性上具有显著优势。此外,还在10段标准视频上与最新显著性视频编码方法进行了主观质量的比较,证实了新方法在低码率编码视频的主观视觉质量提升方面更优。 这项工作为视频编码领域提供了一个新的视角,通过改进的四元傅里叶变换和视觉注意力机制,提升了低码率视频编码的质量,有望在未来视频压缩技术中得到广泛应用。