非平稳噪声环境下基于听觉掩蔽的语音增强算法

需积分: 9 55 浏览量更新于2024-08-12 收藏 559KB PDF 举报

"非平稳噪声环境下的语音增强算法 (2010年)" 语音增强是通信、音频处理和听力辅助设备中的关键技术，特别是在非平稳噪声环境中，如交通噪音、风噪声或室内混合声等，清晰的语音通信面临极大挑战。这篇2010年的论文由程添、郭雷、赵天云和贺胜发表于《西北工业大学学报》，提出了一种创新的算法，旨在解决在低信噪比条件下的语音质量提升问题。在非平稳噪声环境下，传统的语音增强方法可能无法有效抑制背景噪声，同时会引入语音失真。论文提出的算法主要基于两个核心思想：非平稳噪声估计和人耳听觉掩蔽效应。首先，算法通过分析语音信号的低频区和高频区特性，构建了一个时变的权重系统，这个权重能够实时估计并更新噪声的状态，适应环境的变化。这种方法有助于快速跟踪噪声环境的动态特性，从而提供更准确的噪声抑制。其次，论文结合了人耳听觉掩蔽效应这一生理现象。人耳在感知声音时，某些频率的声音会被同一时间存在的较强声音所“掩蔽”，这意味着在特定的频段内，即使噪声存在，只要其强度低于掩蔽阈值，人耳就可能感知不到。因此，算法计算每一帧语音在Bark域（一种与人耳感知相关的频率域）的噪声掩蔽阈值，利用这些阈值自适应地调整语音增强系数。这使得算法能够根据人耳的感知特性，更精细地处理噪声和语音，减少增强过程中可能产生的失真。通过仿真对比，该算法在抑制背景噪声、提高信噪比以及减少语音失真方面表现出优越性，相比于传统的语音增强技术，它能更好地处理非平稳噪声环境中的语音信号。论文的贡献在于提供了一种更加实际和有效的解决方案，对于语音处理领域的研究和实际应用具有重要意义。总结来说，这篇文章探讨的是一种结合非平稳噪声估计和听觉掩蔽效应的语音增强算法，适用于低信噪比和非平稳噪声环境。该算法的成功在于它能够实时适应环境变化，同时考虑了人类听觉系统的特性，从而在保持语音质量的同时有效地降低了噪声干扰。这种技术在语音识别、语音通信和音频处理等领域的应用有着广泛前景。

2010

年

月

第

卷第

期

西北工业大学学报

Oct.

2010

l.却

No.5

Joumal

Northwestern

Pol

严

echnical

Univemity

非平稳噪声环境下的语音增强算法

程添，郭雷，赵天云，贺胜

(西北工业大学自动化学院，陕西西安

∞

72)

摘

要:文章针对非平稳噪声环境和低信噪比的情况，提出了一种基于低频区和高频区带噪语音特性

的非平稳噪声估计，并结合人耳听觉掩蔽效应进行语音增强的算法。该算法首先通过非乎稳噪声估

计为加窗后的每一帧语音构造一个时变的权值实现对噪声的实时估计，然后结合人耳听觉特性计算

出每一帧语音的不同

Bark

域的噪声掩蔽阐佳，最后利用计算出的噪声掩蔽闽佳自适应设定语音增强

系数。仿真结果表明，该算法在抑制背景噪声，提高信噪比，减少语音失真等方面优于传统的语音增

强方法。

关键词:信噪比;估计;非平稳噪声估计;听觉掩蔽效应;语音增强

申图分类号:TP3

文献标识码

文章编号

:1α)()-2758

(2010)

-0

664

-0

近年来，语音增强算法发展迅速并已取得重大

进展，传统增强算法在平稳的声学环境及较高信噪

比时能取得较好的效果，然而，在非平稳噪声环境及

低信噪比下的增强结果由于语音失真和残留噪声的

影响而不能令人满意。

为了减少语音失真和残留噪声对听觉效果的影

响，

Yamauchi[l)

及

Yam

幽

hita[2)

提出了基于噪声估计

的增强算法，与传统的增强算法相比，噪声明显减

少，残留音乐噪声也得到了一定抑制;

Vir

鸣

[3)

将人

耳听觉掩蔽特性应用到非线性谱减法语音增强算法

中，部分解决了谱减法残留音乐噪声大的问题。但

上述几种算法在非平稳噪声环境及低信噪比的情况

下，残留音乐噪声和语音失真现象依然存在，增强敖

果不甚理想。为此本文提出了一种基于非平稳噪声

估计和人耳听觉掩蔽效应相结合的语音增强算法。

该算法无需判断语音的有/元，利用低频区和高频区

带噪语音特性来构造一个时变的权值，该权值可以

实时地对噪声的估计值进行更新，从而可以达到快

速眼踪外界环境变化的目的。然后利用估计出的噪

声同时结合听觉掩蔽效应自适应设定增强系数。仿

真结果表明本文的语音增强算法对于输人为低信噪

比的带噪语音在提高信噪比、抑制背景噪声、减少语

音失真等方面取得了较好的效果。

语音增强算法

假设含噪语音信号

y(n)

表示为

:y(n)

= s(n)

时，其中

s(n)

为纯净语音信号

，

d(n)

为加性

噪声

，

s(n)

和

d(n)

统计不相关。由于增强是按帧

进行的，所以可把上述模型写成帧的形式

y(m ,

= s(m ,

d(m

m = 1,2,

""";n

,1,… ,

N-l

(1)

式中

，

为帧号

，

为帧长，对其进行傅里叶变换得

Y(m

= S(m ,

D(m

(2)

设语音增强系统的增益函数为

G(m

，

则增强语

音的频谱

S(m

,k)

为带噪语音的短时频谱

Y(m

乘以系统增益函数

G(m

，

即

S(m

1 =

G(m

Y(m

:s:;

G(m

，

运

(3)

本文拟采用

Berouti

等人

[4)

提出的方法中的增益

函数

G(m

(「卡川-叮叫

4dα

刊创刊[~归

巳?引妇切时川

汇以

汇刃切

♂;♂;

{护

β[Ul?

引

以;汇刃

趴川

川川;川川川

川厅

门

丁

rτ\

，

其它

收稿日期

，

ω-10-13

基金项目:航空科学基金

∞

80153

伽)资助

作者简介:程

添

(1984

-)，西北工业大学博士研究生，主要从事信号处理、模式识别与智能系统的研究。

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38723559

粉丝: 2

非平稳噪声环境下基于听觉掩蔽的语音增强算法

MATLAB之语音增强算法

论文研究-基于非平稳噪声估计的改进谱减语音增强算法.pdf

基于DNN的子空间语音增强算法

噪声环境下语音增强算法探讨

噪声环境下语音识别算法研究

不利环境中的语音增强：非平稳噪声驱动的语音增强-matlab开发

深度神经网络子空间语音增强算法对抗非平稳噪声

论文研究-一种新的强噪声环境下的语音增强算法.pdf

VC 与Matlab混合编程环境下语音增强算法实现.pdf

冲击噪声环境下基于信号子空间的多通道语音增强算法 (2007年)

最新资源