基于OM-LSA与MCRA的非稳态噪声环境语音增强方法

需积分: 9 1 下载量 137 浏览量 更新于2024-07-20 收藏 387KB PDF 举报
本文主要探讨了在非平稳噪声环境中对语音进行增强的信号处理方法,特别关注的是基于SPEEX(Semi-Parametric Efficient Expert Encoder)的降噪技术。作者Israel Cohen和Baruch Berdugo来自Lamar信号处理有限公司,他们的研究发表在2001年的《信号处理》(Signal Processing)杂志第81卷,2403-2418页,该文章可以从Elsevier网站获取,链接为<www.elsevier.com/locate/sigpro>。 论文的核心内容是提出了一种优化修改的对数谱幅度(OM-LSA)语音估计器,这是一种针对非平稳噪声环境设计的语音信号估计算法。OM-LSA通过最小化对数谱估计的均方误差,利用一个加权几何平均的方式,结合与语音存在不确定性相关的假设增益。这种方法考虑了语音活动的概率分布,以提高估计的准确性。 此外,论文还介绍了最小均值控制递归平均(MCRA)噪声估计策略。MCRA通过过去频谱功率值的平均来估计噪声,这个过程中的平滑参数会根据子带中语音存在概率动态调整。这样做的目的是为了更好地适应不断变化的噪声环境,使得噪声估计更为精确。 作者进一步引入了两种不同的语音存在概率函数。第一种用于估计语音活动,它基于信号与噪声比(SNR)的时间-频率分布,能够更准确地识别语音信号在不同时间、频率位置上的特性。第二种函数则用于控制噪声谱的自适应性,确保噪声估计的稳定性和鲁棒性。 这篇论文提供了一种创新的信号处理框架,通过结合OM-LSA估计和MCRA噪声估计,以及智能地利用语音存在概率,为非平稳噪声环境下的语音增强任务提供了一种有效的解决方案。这对于实际应用,如语音通信、语音识别等领域,具有重要的理论和实践价值。
2004-11-13 上传