自适应阈值与新阈值函数结合的小波包语音增强技术

需积分: 9 0 下载量 125 浏览量 更新于2024-09-08 收藏 2.53MB PDF 举报
"这篇论文研究了一种新的小波包语音增强算法,该算法结合了自适应阈值和新阈值函数,旨在解决传统小波包语音增强方法导致的语音失真问题。通过在小波包域对带噪语音进行加窗分帧,利用相邻帧的快速傅里叶变换功率谱互相关值来计算各帧存在语音的概率,进而调整阈值,使其在非语音帧中较高,而在语音帧中较低,以实现阈值的自适应调整。同时,设计的新阈值函数弥补了传统硬阈值和软阈值函数的不足,降低了语音失真的程度。论文通过TIMIT和NOISEX-92数据库的大量模拟实验,验证了所提算法在语音增强效果上的优越性,表明其可以显著减少失真,提高听觉效果。" 这篇研究论文探讨了在语音处理领域的一个关键问题,即如何有效地增强语音信号并减少噪声干扰。传统的语音增强算法在消除噪声的同时往往导致语音失真,影响了语音的可理解性和质量。论文提出了一种创新的方法,结合了自适应阈值策略和新设计的阈值函数,以改善小波包分析在语音增强中的应用。 首先,算法的核心在于利用小波包变换,将带噪语音信号分解到多个频带。通过对每帧信号进行加窗处理,可以得到不同频率成分的细节信息。然后,通过计算相邻帧的快速傅里叶变换(FFT)功率谱的互相关值,可以估计出当前帧中存在语音的概率。这种概率评估有助于区分语音帧和噪声帧,从而为自适应阈值的设定提供依据。 自适应阈值机制是该算法的关键组成部分。在非语音帧中,设置较高的阈值有助于更有效地去除噪声;而在语音帧中,阈值降低,以保护语音信号的完整性。这样的设计减少了对语音的过度去噪,从而降低了失真的程度。 其次,为了进一步优化去噪效果,研究人员设计了一种新的阈值函数。这个新函数旨在克服传统阈值函数(如硬阈值和软阈值)的局限性。硬阈值函数可能导致信号的不连续性,而软阈值函数则可能引入恒定的偏差。新函数在保持信号连续性的同时,能够更精确地平衡噪声去除和信号保真之间的关系,从而减少语音失真。 通过TIMIT和NOISEX-92这两个广泛使用的语音和噪声数据库进行大量实验,论文的作者们比较了所提算法与其他两种现有算法的性能。主观和客观的评价结果显示,提出的语音增强算法在减少失真和提升听觉体验方面具有显著优势。 这项研究为语音增强技术带来了新的视角和方法,对于提高噪声环境下的语音通信质量和可理解性具有重要意义。结合自适应阈值和新阈值函数的小波包语音增强算法为未来的研究提供了新的思路,有望在实际应用中改善语音处理系统的性能。