基于Itakura-Saito测度与心理声学模型的语音信息隐藏方法

需积分: 9 2 下载量 120 浏览量 更新于2024-09-18 收藏 1.7MB PDF 举报
本文主要探讨了一种基于Itakura-Saito测度与心理声学模型的新型语音信息隐藏方法。传统语音信息隐藏技术存在一些局限性,如恒定的嵌入幅度、较低的语音质量以及较高的比特错误率。作者提出的新方法旨在解决这些问题,通过结合Itakura-Saito测度和心理声学模型来实现对嵌入幅度的有效控制。 Itakura-Saito测度是一种在语音信号处理中广泛应用的距离度量方法,它在音频信号分析中能够提供一个有效的对比度指标。这种方法利用了人类听觉系统的特性,特别是对不同频率成分的敏感程度,通过测量信号间的相似性来确定嵌入信息的最佳位置。 首先,论文描述的隐藏过程涉及将原始语音信号进行小波包变换,这种变换可以将信号分解成多个子带,每个子带对应人耳感知的特定频段,即所谓的“临界带”。这样做的目的是利用频域的局部特征,以便在不影响听觉感知的情况下进行信息嵌入。 嵌入过程中,作者根据音频掩蔽阈值来决定每个子带中的嵌入幅度。掩蔽阈值模拟了人耳对不同声音强度的感知,确保在嵌入信息的同时保持语音的自然感受。Itakura-Saito测度在此时发挥作用,通过计算调整因子来精细调控每个帧的嵌入强度,确保整体嵌入过程中语音质量的改善。 与传统方法相比,新方法的显著优势在于其能自动适应语音内容和环境条件,使得嵌入的隐蔽性和语音质量达到更佳的平衡。实验结果显示,这种基于Itakura-Saito测度和心理声学模型的语音信息隐藏方法在性能上超越了传统的隐藏技术,为实时通信网络中的安全信息传输提供了新的可能性。 本文的研究不仅创新了语音信息隐藏的技术手段,还展示了如何利用心理学原理提升信息隐藏的效率和安全性,这对于信息安全领域,特别是在语音通信网络中,具有重要的实际应用价值。