非平稳宽带噪声语音增强：简化KL T与小波变换方法

125 浏览量更新于2024-08-30 收藏 308KB PDF 举报

"基于简化的KL T 和小波变换的非平稳宽带噪声语音增强" 本文主要探讨了一种针对非平稳宽带噪声环境下语音增强的新方法，该方法结合了二进小波变换和简化的Karhunen-Love变换（KL T）。在语音处理领域，尤其是在噪声环境中提高语音清晰度是关键问题，特别是在非平稳宽带噪声的情况下，这通常会导致语音质量严重下降，影响通信效果。二进小波变换是一种多分辨率分析工具，能够将信号在时间和频率上进行精细分析。它通过不同尺度和位置的滤波器来分解信号，使得信号的局部特性可以被更好地捕获。在语音增强中，小波变换能够帮助识别和分离语音信号与噪声信号，因为它们在小波域中的表现不同。简化的KL T 是一种统计线性变换，用于降低数据的维度并保留其主要特征。在语音增强的应用中，它用于将带噪语音信号分解为一组正交基，这些基向量代表了信号的主要成分。通过选择最重要的几个基向量，可以有效地去除噪声，同时保持语音的基本结构。在该研究中，算法首先利用二进小波变换对带噪语音进行分解，然后在KL T 矢量空间中进一步处理。针对浊音和清音这两种不同的语音类型，算法采用不同的处理策略，以适应它们在噪声环境下的特性。值得注意的是，这种方法无需预计算噪声的白化或信噪比，简化了处理流程，提高了实时性能。通过与其他语音增强系统的对比实验，该算法在失真测度分析中表现出优越性，有效克服了传统方法的局限，尤其是在非平稳宽带噪声环境下，对噪声的整形和抑制效果显著。实验结果证明，这种方法能有效提升噪声环境中的语音质量，对提高语音通信的可理解性和用户体验具有重要意义。这项研究为非平稳宽带噪声条件下的语音增强提供了一个创新的解决方案，结合了小波变换的时频分析能力和KL T 的特征提取能力，有望在实际应用中，如语音通信、语音识别等领域，改善噪声环境下的语音处理效果。

第 18 卷第 5 期

Vol. 18 No. 5

　控　制　与　决　策

　Control and D ecision　

2003 年 9 月

　Sept. 2003

　　文章编号: 100120920

(

2003

)

0520577204

基于简化的

KL T

和小波变换的非平稳宽带噪声语音增强

楼红伟, 胡光锐

(

上海交通大学电子工程系, 上海 200030

)

摘　要: 针对非平稳宽带噪声语音增强存在的困难, 提出一种基于二进小波变换和简化的

Karhunen

Loeve

变换

(

KL T

)

的语音增强算法。通过基于小波空间和

KL T

矢量空间分解带噪语音信号, 并针对浊

音和清音分别进行处理和重构, 在无需进行噪声的白化及信噪比大小的预先计算条件下, 实现了语音增

强。在不同的语音增强系统对比实验中, 通过失真测度分析表明了该算法能克服以往方法的固有缺陷,

在非平稳宽带噪声的语音增强中, 对噪声的整形和抑制具有较好的作用。

关键词: 语音增强;

Karhunen

Loeve

变换; 二进小波变换

中图分类号:

391. 42　　　　文献标识码:

Simplif ied KLT and wavelet transform based approach

for enhancing speech degraded by non

stationary wideband noise

L OU H ong

w ei

H U Guang

rui

(

Departm ent of Electronic Engineering

Shanghai J iaotong U niversity

Shanghai

200030,

China

)

Abstract

A im ing to supp ress the non

stationary w ideband noise

a novel speech enhancem ent algo2

rithm based on the dyadic w avelet transform and the simp lified Karhunen

Loeve transform is p ropo sed

The no isy speech is decompo sed into components by the w avelet space and KL T

based vector space

A nd the components are p rocessed and reconstructed respectively by distinguishing betw een vo iced

speech and unvoiced speech

There are no requirem ents of noise w hitening and SNR p recalculating

The experim ents and comparison w ith different speech enhancem ent system s by m eans of the distortion

m easure show that the p ropo sed m ethod overcomes draw backs existing in the p revious m ethods and

perform s better shap ing and supp ressing of the non

stationary w ideband noise fo r speech enhancem ent

Key words

Speech enhancem ent

;

Karhunen

Loeve transform

;

Dyadic w avelet transform

1　引　　言

　　语音在通信过程中不可避免地会受到干扰噪声

的影响, 使接收者接收到的语声已非纯净的原始语

音信号。语音增强是从带噪语音信号中提取尽可能

纯净的原始语音。由于噪声来源众多, 随应用场合而

异, 它们的特性也各不相同。即使在实验室仿真条件

下, 也难以找到一种能适用于各种噪声环境的通用

的语音增强算法, 所以必须针对不同的噪声采取不

同的语音增强对策。噪声种类很多, 但研究最多也最

为常见的是加性噪声, 诸如周期性噪声、脉冲噪声、

宽带噪声以及同声道其他语音的干扰, 其中宽带噪

声又分为平稳和非平稳的。由于宽带噪声与语音信

号在时域和频域上完全重叠, 因而消除它最为困难。

对于平稳的宽带噪声, 可认为它是高斯白噪声, 或许

　收稿日期: 2002205223; 修回日期: 2002207231。

　基金项目: 国家自然科学基金资助项目

(

69672007

)

。

　作者简介: 楼红伟

(

1976—

)

, 男, 浙江永康人, 博士生, 从事语音信号处理与识别、神经智能等研究; 胡光锐

(

1938—

)

, 男,

上海人, 博士生导师, 从事语音识别、神经网络和通信系统抗干扰等研究。

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38512659

粉丝: 9
资源: 973

非平稳宽带噪声语音增强：简化KL T与小波变换方法

语音处理相关论文（共81篇）

基于KL变换的人脸识别 matlab

基于KL变换的人脸识别报告.doc

基于kl变换的人脸识别

matlab对图像进行KL变换,kl变换特征提取

基于kl变换人脸识别课件

讨论PCA和KL变换的异同

KL变换和PCA的原理一样吗

基于kl变换的人脸识别判断一个照片是否为人脸代码

最新资源