语音增强技术在IMBE声码器中的应用研究

需积分: 12 13 下载量 111 浏览量 更新于2024-11-14 收藏 266KB PDF 举报
"戴怀宇和曹志刚在清华大学的研究中探讨了语音增强IMBE声码器的构建和应用,旨在提升MBE声码器在噪声环境下的性能。" 多带激励模型(MBE)是由Griffin在1987年提出的,这是一种用于语音编码的技术,尤其在中低速率下能提供高质量的合成语音。MBE声码器通过分解语音信号为多个频带并分别编码,从而实现高效的数据压缩。然而,当在噪声环境中使用时,MBE声码器的表现会随着输入信噪比(SNR)的降低而显著恶化。 为了解决这一问题,研究人员提出了两种策略。第一种策略是使用语音增强预处理器与IMBE声码器串联。语音增强预处理器的目标是通过去噪、增益控制等手段提升输入语音信号的质量,然后再送入IMBE声码器进行编码。这种方法可以先期消除或减少噪声对编码过程的影响。 第二种策略更进一步,将语音增强技术直接集成到IMBE声码器内部,构建所谓的语音增强IMBE声码器。这种方式可能涉及修改MBE模型,使其具备内建的噪声抑制功能,从而在整个编码过程中都能对抗噪声干扰。 通过对这两种系统的客观测试和主观试听评估,研究发现它们在噪声环境中的表现均有显著提升。这意味着即使在嘈杂的通信条件下,也能保持较好的语音清晰度和可理解性,这对于卫星通信、移动通信等场景尤其重要。 关键词:多带激励模型,双激励模型,语音编码,语音增强,声码器 总结起来,这项研究展示了结合语音增强技术的IMBE声码器对于改善噪声环境下的语音通信质量具有显著效果,为今后的语音编码研究和应用提供了新的思路。通过优化声码器设计,尤其是在高噪声环境中的性能,可以极大地提升通信系统的用户体验。
2024-11-29 上传