基于听觉掩蔽效应和最优平滑的语音增强算法
覃爱娜 ,戴 亮,桂卫华
(中南大学信息科学与工程学院,长沙 410083)
摘 要:针对谱减法在低信噪比下音乐噪声较大的缺点,通过分析人耳听觉掩蔽特性,提出一种改进的语音增强算法。在维纳滤
波法的基础上结合掩蔽效应调整增益系数,采用非平稳环境下的最小约束递归平均算法进行噪声参数估计,利用最小均方误差准
则的最优平滑因子对增强语音进行平滑处理,从而进一步消除音乐噪声。仿真结果表明,与改进谱减法与维纳滤波法相比,该算
法在低信噪比情况下能有效抑制背景噪声和残余的音乐噪声,保持较好的语音质量和清晰度。
关键词:语音增强;听觉掩蔽效应;最优平滑;维纳滤波;最小约束递归平均法;最小均方误差
Speech Enhancement Algorithm
Based on Auditory Masking Effect and Optimal Smoothing
QIN Ai -na, D AI liang, GUI Wei-hua
(School of Information Science and Engineering, Central South University, Changsha 410083, China)
【Abstract】An improved speech enhancement algorithm is proposed by analysis the human auditory masking properties when a serious
problems of residual musical noise brought by the Spectral subtraction in low Signal Noise Ratio(SNR). The gain parameters are adjusted
by combined human auditory masking properties with wiener filter. Noise estimation is used by the Minimum Controlled Recursive
Averaging(MCRA) algorithm in non-stationary environment. In order to further eliminate the musical noise, the optimal smoothing factor
based on Minimum Mean Square Error(MMSE) is used to smooth the enhanced voice. Simulation results show that compared with the
improved spectral subtraction and Wiener filtering method, the algorithm can effectively suppress background noise and residual musical
noise as well as maintaining speech quality and intelligibility in low SNR.
【Key words】speech enhancement; auditory masking effect; optimal smoothing; wiener filtering; Minimum Controlled Recursive
Averaging(MCRA) method; Minimum Mean Square Error(MMSE)
DOI: 10.3969/j.issn.1000-3428.2013.08.006
1
概述
随着数字通信技术的快速发展 , 语音增强在语音信号
处理方面的作用越来越重要 。 语音增强是从带噪语音信号
中提取尽可能纯净的原始语音 , 其主要目的有消除背景噪
音 、 提高语音可懂度 、 改进语音质量 、 使听者乐于接受并
且不会感觉到疲劳 。 目前 , 在平稳的噪声环境下语音增强
可以获得较好的效果 , 但在非平稳环境下 , 尤其在低信噪
比情况下对语音增强算法的研究仍是一个重要的方向 。
谱减法是一种经典的语音增强算法 , 其原理是从带噪
语音功率谱中减去噪声功率谱来估计纯净语音的功率谱 。
但该算法在抑制背景噪声的同时会产生音乐噪声 , 不仅对
听 觉效果产生一定的干扰 , 还会影响后续的处理如语音编
码 、 识别等 。 维纳滤波法是在最小均方准则下实现对语音
信号的最优估计 , 其优点是增强后的残留噪声类似于白噪
声 。 目前基于小波变换
[1]
、 神经网络
[2]
、 人耳听觉掩蔽
[3-4]
效应的方法是语音增强领域的研究热点 。 人耳的听觉掩蔽
效应是当
2
个响度不等的声音作用于人耳时 , 响度较高的
频率成分的存在会影响对响度较低的频率成分的感受 , 使
其变得不易察觉 。本文在掩蔽效应和维纳滤波法的基础上 ,
结合 最小均方误差
(Minimum Mean S quare Error , MMSE )
设
计最优平滑因 子 , 提出一种改进增强算法
—
基于听觉掩蔽
效应和最优平滑的语音增强算法 。
2
语音增强算法描述
基于掩蔽效应和最优平滑的语音增强算法主要分 为
3
个 部分 :
(1)
对带噪语音信号进行预处理及噪声参数估计 ;
(2)
利用估计的噪声对带噪语音信号进行维纳滤波及计算掩