非平稳噪声环境下基于听觉掩蔽的语音增强算法

需积分: 9 0 下载量 55 浏览量 更新于2024-08-12 收藏 559KB PDF 举报
"非平稳噪声环境下的语音增强算法 (2010年)" 语音增强是通信、音频处理和听力辅助设备中的关键技术,特别是在非平稳噪声环境中,如交通噪音、风噪声或室内混合声等,清晰的语音通信面临极大挑战。这篇2010年的论文由程添、郭雷、赵天云和贺胜发表于《西北工业大学学报》,提出了一种创新的算法,旨在解决在低信噪比条件下的语音质量提升问题。 在非平稳噪声环境下,传统的语音增强方法可能无法有效抑制背景噪声,同时会引入语音失真。论文提出的算法主要基于两个核心思想:非平稳噪声估计和人耳听觉掩蔽效应。首先,算法通过分析语音信号的低频区和高频区特性,构建了一个时变的权重系统,这个权重能够实时估计并更新噪声的状态,适应环境的变化。这种方法有助于快速跟踪噪声环境的动态特性,从而提供更准确的噪声抑制。 其次,论文结合了人耳听觉掩蔽效应这一生理现象。人耳在感知声音时,某些频率的声音会被同一时间存在的较强声音所“掩蔽”,这意味着在特定的频段内,即使噪声存在,只要其强度低于掩蔽阈值,人耳就可能感知不到。因此,算法计算每一帧语音在Bark域(一种与人耳感知相关的频率域)的噪声掩蔽阈值,利用这些阈值自适应地调整语音增强系数。这使得算法能够根据人耳的感知特性,更精细地处理噪声和语音,减少增强过程中可能产生的失真。 通过仿真对比,该算法在抑制背景噪声、提高信噪比以及减少语音失真方面表现出优越性,相比于传统的语音增强技术,它能更好地处理非平稳噪声环境中的语音信号。论文的贡献在于提供了一种更加实际和有效的解决方案,对于语音处理领域的研究和实际应用具有重要意义。 总结来说,这篇文章探讨的是一种结合非平稳噪声估计和听觉掩蔽效应的语音增强算法,适用于低信噪比和非平稳噪声环境。该算法的成功在于它能够实时适应环境变化,同时考虑了人类听觉系统的特性,从而在保持语音质量的同时有效地降低了噪声干扰。这种技术在语音识别、语音通信和音频处理等领域的应用有着广泛前景。