-1-
几种常用语音增强算法的研究
吴晓宇
北京邮电大学信息与通信工程学院,北京 (100876)
E-mail:eiffelwu@hotmail.com
摘 要:语音增强算法是语音信号处理领域一个重要分支,它通过对语音信号进行预处理,
抑制或消除背景噪声,提高语音质量。本文介绍了谱减法,维纳滤波法,STSA-MMSE 算法
这几种常见的语音增强算法的原理,最后在 VoIP 系统中实现 STSA-MMSE 算法,证明其在
发送端的降噪作用,并有效的提高了语音质量。
关键词:语音增强算法;谱减法;维纳滤波法;STSA-MMSE 算法;VoIP 系统
中图分类号:TN713
1.引言
现实生活中的语音不可避免地要受到周围环境的影响,很强的背景噪声例如机器噪声、
其它说话者的语音等均会严重地影响语音信号的质量;此外传输系统本身也会产生各种噪
声。因此提出了在发送端将混入语音中的噪声消除的必要性。语音增强方法的研究始于 20
世纪 70 年代中期。随着数字信号处理理论的成熟,语音增强发展成为语音信号处理领域的
一个重要分支。1978 年,Lim 和 Oppenheim 提出了语音增强的维纳滤波方法。1979 年,Boll
提出了谱相减方法来抑制噪声。1950 年,Maulay 和 Malpass 提出了软判决噪声抑制方法 。
1984 年,Ephraim 和 Malah 提出基于 MMSE 短时谱幅度估计的语音增强方法。增强方法的
研究第一章语音增强方法概述 1987 年,Paliwal 把卡尔曼滤波引入到语音增强领域
[1]
。在近
30 年的研究中,各种语音增强方法不断被提出,它奠定了语音增强理论的基础并使之逐渐
走向成熟。近些年来,随着 VLSI 技术的发展和高速 DSP 芯片的出现,语音增强方法逐步走
向实用,同时新的语音增强方法又相继涌现。
2.几种常用语音增强算法原理
语音增强算法按时域与频域分为两类:时域方法主要有基于子空间的语音增强算法;频
域方法主要有谱减法、基于 MMSE 的语音增强算法等。相对来说,时域方法计算量较大而
频域方法计算量较小。下面介绍一下比较常用的几种算法。
2.1 谱减法
谱减法由 Weiss,Aschkenasy 和 Parsons 提出,Berouti,Schwartz,Makhoul 进一步发展了它,
并将频谱的压缩和对噪声成分的过估计(或欠估计)考虑了进去。之后,它又不断的得到了
发展,是处理宽带噪声较为传统和有效的方法。其基本思路是在假定带噪语音中的噪声为加
性噪声且与短时平稳的语音信号相互独立,这样便可从带噪语音的功率谱中减去噪声功率
谱,从而得到较为纯净的语音频谱,再经过变换得到去噪的语音信号。介绍谱减法是因为到
目前为止谱减法及许多从谱减法衍生而来的语音增强方法仍然是这个领域中最常用最有效
的方法之一。
如果设 s(t)为纯净语音信号,n(t)为噪声信号,x(t)为带噪语音信号,则有:
() () () (1)xt st nt=+
用 X(ω)、S(ω)、N(ω)分别表示 x(t)、s(t)、n(t)的傅里叶变换,则可得下式:
() () () (2)Xw Sw Nw=+
http://www.paper.edu.cn
中国科技论文在线
评论0