2010
年
10
月
第
28
卷第
5
期
西北工业大学学报
Oct.
2010
Vo
l.却
No.5
Joumal
of
Northwestern
Pol
严
echnical
Univemity
非平稳噪声环境下的语音增强算法
程添,郭雷,赵天云,贺胜
(西北工业大学自动化学院,陕西西安
71
∞
72)
摘
要:文章针对非平稳噪声环境和低信噪比的情况,提出了一种基于低频区和高频区带噪语音特性
的非平稳噪声估计,并结合人耳听觉掩蔽效应进行语音增强的算法。该算法首先通过非乎稳噪声估
计为加窗后的每一帧语音构造一个时变的权值实现对噪声的实时估计,然后结合人耳听觉特性计算
出每一帧语音的不同
Bark
域的噪声掩蔽阐佳,最后利用计算出的噪声掩蔽闽佳自适应设定语音增强
系数。仿真结果表明,该算法在抑制背景噪声,提高信噪比,减少语音失真等方面优于传统的语音增
强方法。
关键词:信噪比;估计;非平稳噪声估计;听觉掩蔽效应;语音增强
申图分类号:TP3
91
文献标识码
:A
文章编号
:1α)()-2758
(2010)
05
-0
664
-0
5
近年来,语音增强算法发展迅速并已取得重大
进展,传统增强算法在平稳的声学环境及较高信噪
比时能取得较好的效果,然而,在非平稳噪声环境及
低信噪比下的增强结果由于语音失真和残留噪声的
影响而不能令人满意。
为了减少语音失真和残留噪声对听觉效果的影
响,
Yamauchi[l)
及
Yam
幽
hita[2)
提出了基于噪声估计
的增强算法,与传统的增强算法相比,噪声明显减
少,残留音乐噪声也得到了一定抑制;
Vir
鸣
[3)
将人
耳听觉掩蔽特性应用到非线性谱减法语音增强算法
中,部分解决了谱减法残留音乐噪声大的问题。但
上述几种算法在非平稳噪声环境及低信噪比的情况
下,残留音乐噪声和语音失真现象依然存在,增强敖
果不甚理想。为此本文提出了一种基于非平稳噪声
估计和人耳听觉掩蔽效应相结合的语音增强算法。
该算法无需判断语音的有/元,利用低频区和高频区
带噪语音特性来构造一个时变的权值,该权值可以
实时地对噪声的估计值进行更新,从而可以达到快
速眼踪外界环境变化的目的。然后利用估计出的噪
声同时结合听觉掩蔽效应自适应设定增强系数。仿
真结果表明本文的语音增强算法对于输人为低信噪
比的带噪语音在提高信噪比、抑制背景噪声、减少语
音失真等方面取得了较好的效果。
1
语音增强算法
假设含噪语音信号
y(n)
表示为
:y(n)
= s(n)
+
d(
时,其中
s(n)
为纯净语音信号
,
d(n)
为加性
噪声
,
s(n)
和
d(n)
统计不相关。由于增强是按帧
进行的,所以可把上述模型写成帧的形式
y(m ,
n)
= s(m ,
n)
+
d(m
,
n)
m = 1,2,
""";n
=0
,1,… ,
N-l
(1)
式中
,
m
为帧号
,
N
为帧长,对其进行傅里叶变换得
Y(m
,
k)
= S(m ,
k)
+
D(m
,
k)
(2)
设语音增强系统的增益函数为
G(m
,
k)
,
则增强语
音的频谱
1
S(m
,k)
1
为带噪语音的短时频谱
1
Y(m
,
k)
1
乘以系统增益函数
G(m
,
k)
,
即
1
S(m
,
k)
1 =
G(m
,
k)
.1
Y(m
,
k)
1,
o
:s:;
G(m
,
k)
运
1
(3)
本文拟采用
Berouti
等人
[4)
提出的方法中的增益
函数
G(m
,
k)
=
(「卡川-叮叫
4dα
刊创刊[~归
1
巳?引妇切时川
jz
汇以
m;
汇刃切
:1
♂;♂;
{护
β[Ul?
引
jz
以;汇刃
:1
趴川
;2
川川;川川川
l
川厅
f
门
2
丁
rτ\
,
其它
收稿日期
:2
,
ω-10-13
基金项目:航空科学基金
(2
∞
80153
伽)资助
作者简介:程
添
(1984
-),西北工业大学博士研究生,主要从事信号处理、模式识别与智能系统的研究。