Sparse K-SVD学习字典在语音增强中的应用

需积分: 25 128 浏览量更新于2024-08-11 1 收藏 350KB PDF 举报

"基于Sparse K-SVD学习字典的语音增强方法 (2014年)" 本文探讨了一种创新的语音增强技术，该技术利用Sparse K-SVD算法来学习一个能够高效表示语音信号的冗余字典。Sparse K-SVD是一种自适应的方法，它能根据输入的语音信号动态调整字典，使得语音信号能够在字典上实现稀疏分解。这种稀疏表示对于语音信号的噪声抑制和质量提升至关重要。传统的语音增强方法，如小阈值波法、谱减法和改进谱减法，虽然在一定程度上可以降低噪声，但可能无法完全恢复语音的原始质量和清晰度。相比之下，基于稀疏表示的语音增强方法，特别是使用Sparse K-SVD和K-SVD训练的字典，显示出更好的性能。在NOIZEUS语音库上的实验结果表明，这些方法能显著提高语音的质量和可理解性。文章还比较了Sparse K-SVD和K-SVD两种算法在字典训练时间上的差异。结果显示，Sparse K-SVD算法在训练时间上比K-SVD算法减少了大约1/6到1/10，这极大地提升了计算效率，使得这种方法更适用于实时或资源有限的环境。稀疏表示理论在信号处理领域有着广泛的应用，包括但不限于语音信号压缩、图像增强和人脸识别。然而，构建一个有效的冗余字典是实现这一目标的关键。传统的字典构建方法，如固定字典法和字典训练法，各有其局限性。固定字典缺乏对信号变化的适应性，而字典训练法则可能导致字典结构松散，限制了其表示能力，并增加了计算负担。为了克服这些问题，Rubinstein等人提出的Sparse K-SVD算法提供了一种新的字典学习策略。它不仅能够学习到更适合语音信号的字典，而且在训练效率上有了显著的提高。通过这种方法，可以更好地捕捉语音信号的特性，从而在噪声环境中实现更精确的语音分离和增强。这项研究为语音增强领域带来了重要的进展，通过优化字典学习过程，实现了更高效的噪声抑制和语音质量提升，同时降低了计算复杂度，为实际应用提供了更优的选择。

第

卷第

期

2014

年

月

厦门大学学报(自然科学版)

53 No.1

Jan.

2014

Journal

Xiamen

University

(Natural

Science)

doi:

10.6043/j.issn.0438-04

79.2014.0

008

基于

Sparse

K-SVD

学习字典的语音增强方法

黄玲，李琳\王薇，易才钦，郭东辉

(厦门大学信息科学与技术学院，福建厦门

361005)

摘要:提出一种基于

Sparse

K-SVD

学习字典的语音增强方法，采用

Sparse

K-SVD

算法自适应地训练一个可稀疏表示

的冗余字典，在该冗余字典上采用正交匹配追踪

COMP)

算法对带噪语音信号进行稀疏分解，利用稀疏系数矩阵重构纯

净语音，实现语音增强.使用

NOIZEUS

语音库进行了一系列的语音增强实验，主客观评测数据表明，基于稀疏表示的语

音增强方法(分别使用

Sparse

K-SVD

和

K-SVD

训练字典)相对于传统语音增强方法(小阂值波法、谱减法、改进谱减法)

可进一步改善语音质量;对字典训练时间进行统计，发现

Sparse

K-SVD

算法训练字典消耗的时间为

K-SVD

算法训练

时间的

1/6~1/10

，大幅度提高了计算效率.

关键词:稀疏表示

;Sparse

K-SVD;

自适应字典;语音增强

中图分类号

:TN

912

文献标志码

语音信号增强是指从带噪信号中获取有用的语

音信号，抑制噪声干扰，提升语音自然度和清晰度，常

用的语音增强方法有谱减法

[IJ

、小波阔值法

[2J

、卡尔

曼滤波法

[3J

等.近年来，基于信号稀疏表示的语音增强

算法

[4J

也受到广泛关注.

基于冗余字典的信号稀疏表示方法最早由

Mallat

和

Zha

吨提出，一个可压缩信号在某一空间上

可用极少的观测样本信号以高概率重构.基于信号的

稀疏表示进行信号压缩、图像增强、语音增强、人脸识

别等信号处理[

4-6J

已取得了较好的成果.稀疏表示方

法主要分为两个部分，冗余字典的构建和目标函数的

优化

.Zhang

等的通过实验证明，稀疏表示方法改善信

号处理性能的关键在于冗余字典的构建.目前主要有

种字典构建方法:固定字典法和字典训练法

[8-IOJ

但

这两种方法训练出的字典前者对信号的自适应性不

佳，后者结构松散，字典规模受限，且运算量大.

为了解决上述问题，

Rubinstein

等[lI

提出了一种新

的字典学习方法一

-Sparse

K-SVD

算法，对冗余字典

进一步进行稀疏分解，使用小波变换或离散余弦变换

建立一个基字典

，

并寻找一个稀疏表示系数矩阵

，

使得

D=BA.Sparse

K-SVD

算法通过对字典的稀疏表

示，使得字典

具有良好的自适应性，同时降低了字典

收稿日期

:2013-04-26

铃通信作者:

lilin@xmu.edu.cn

文章编号

:0438-0479(2014)01-0036-05

构建的计算复杂度，能够得到一个结构紧密的字典，利

于进行更高维度、更大规模信号的稀疏表示.

本文提出一种基于稀疏表示的语音增强算法，采

用

Sparse

-SVD

算法训练自适应的冗余字典，再应

用正交匹配追踪

(OMP)

算法进行稀疏编码来重构纯

净语音.在主观质量和客观指标上，基于稀疏表示的语

音增强方法(分别使用

Sparse

-SVD

算法和

K-SVD

算法训练字典)比传统语音增强方法(小波法、谱减

法、改进谱减法)获得更优的性能.在字典训练时间方

面进行分析发现，相对于

K-SVD

字典训练算法，

Sparse

K-SVD

算法大幅度提高了计算效率.

语音信号的稀疏表示原理

任意长度为

的一维离散语音信号

YξRN

，通

过冗余字典

εR

NXK

可稀疏表示为:

Y=D

=~d

山，

(1)

式中

=α

为信号的稀疏表示系数，为

KXl

的向量

，

为给定冗余字典

中的一个原子，的为

向量中与

相对应的值.语音信号的稀疏表示是从冗余字典中

选择具有最佳线性组合的若干原子来表示信号，实际

上是一种逼近过程.从稀疏逼近角度出发，希望在逼近

残差达到最小的情况下得到

最稀疏的一个解.这等

同于解决下述问题

[12J

â =

argminllα110

，使得

Ily-

山

11:

ê ,

(2)

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38732744

粉丝: 4
资源: 856

Sparse K-SVD学习字典在语音增强中的应用

K-SVD实现代码

基于Sparse K-SVD学习字典的语音增强方法

K-SVD_and_W_KSVD_Sparse_Representation.zip_K-SVD稀疏字典表示_KSVD图像分解_

K-SVD经典字典学习算法

K-SVD.rar_K-SVD _K-SVD去噪_ksvd matlab_稀疏编码_稀疏编码去噪

K-SVD Sparse representation

SGK字典学习算法_SVD_K-SVD_K._字典学习算法_SGK字典学习算法

K-svd.rar_K-SVD _K._KSVD_KSVD稀疏_稀疏

KSVD.rar_K-SVD _K._KSVD_SVD_字典

Exposure fusion based on sparse representation using approximate K-SVD

最新资源