宽带话音增强:统计模型与EMD融合技术

需积分: 3 0 下载量 189 浏览量 更新于2024-08-29 收藏 1.66MB PDF 举报
"融合统计模型与EMD的宽带话音增强方法是针对宽带话音在噪声环境中的清晰度提升技术,结合了统计模型和经验模态分解(EMD)的优势。这种方法首先应用统计模型增强算法来减少噪声影响,随后利用基于活动话音检测(VAD)的EMD算法进行后处理,进一步降低残留噪声,从而实现两种方法的高效协同。在ITU-T G.160标准下,该算法的性能得到了验证,显示在不同噪声环境下,增强后的语音信噪比有显著提升,特别是在低信噪比条件下,能够有效抑制高频音乐噪声,提高听感舒适度。" 本文由周璇、鲍长春和夏丙寅在2013年发表于《通信学报》上,他们提出了一个创新的宽带话音增强策略。在宽带话音处理中,噪声抑制是一个关键挑战,因为噪声会严重干扰语音的可理解性和清晰度。统计模型通常用于识别并削弱噪声成分,而EMD是一种时间频率分析方法,能分解信号为一系列简单模态,便于噪声分离。 在这个融合方法中,首先,统计模型被用来分析和消除噪声源,这一步骤有助于去除主要的噪声成分。接下来,引入活动话音检测(VAD),这是一种能够识别出是否为话音活动的技术,通过VAD,可以更精确地定位和处理噪声,尤其是那些在话音静默期活跃的噪声。然后,EMD算法被应用到VAD识别出的话音段,以进一步细化噪声抑制,特别是对那些统计模型可能未完全消除的残留噪声。 实验结果显示,与传统的仅依赖统计模型的方法相比,这个融合方法在各种噪声强度下都能提供更好的话音增强效果,表现为增强后语音的信噪比有显著提高。在低信噪比环境下,该方法的优越性尤为突出,因为它能有效抑制高频音乐噪声,这是统计模型单独应用时难以解决的问题。这种抑制减少了高频噪声对听觉体验的负面影响,提高了听众的舒适度。 这项工作为宽带话音增强提供了新的思路,将统计模型的噪声估计能力与EMD的时间频率分析能力相结合,为噪声环境下的语音通信质量提升提供了有效手段。这一方法不仅适用于语音通信系统,还可能应用于语音识别、语音合成以及其他需要清晰语音信号的领域。