第
53
卷第
1
期
2014
年
1
月
厦门大学学报(自然科学版)
Vo
1.
53 No.1
Jan.
2014
Journal
of
Xiamen
University
(Natural
Science)
doi:
10.6043/j.issn.0438-04
79.2014.0
1.
008
基于
Sparse
K-SVD
学习字典的语音增强方法
黄玲,李琳\王薇,易才钦,郭东辉
(厦门大学信息科学与技术学院,福建厦门
361005)
摘要:提出一种基于
Sparse
K-SVD
学习字典的语音增强方法,采用
Sparse
K-SVD
算法自适应地训练一个可稀疏表示
的冗余字典,在该冗余字典上采用正交匹配追踪
COMP)
算法对带噪语音信号进行稀疏分解,利用稀疏系数矩阵重构纯
净语音,实现语音增强.使用
NOIZEUS
语音库进行了一系列的语音增强实验,主客观评测数据表明,基于稀疏表示的语
音增强方法(分别使用
Sparse
K-SVD
和
K-SVD
训练字典)相对于传统语音增强方法(小阂值波法、谱减法、改进谱减法)
可进一步改善语音质量;对字典训练时间进行统计,发现
Sparse
K-SVD
算法训练字典消耗的时间为
K-SVD
算法训练
时间的
1/6~1/10
,大幅度提高了计算效率.
关键词:稀疏表示
;Sparse
K-SVD;
自适应字典;语音增强
中图分类号
:TN
912
文献标志码
:A
语音信号增强是指从带噪信号中获取有用的语
音信号,抑制噪声干扰,提升语音自然度和清晰度,常
用的语音增强方法有谱减法
[IJ
、小波阔值法
[2J
、卡尔
曼滤波法
[3J
等.近年来,基于信号稀疏表示的语音增强
算法
[4J
也受到广泛关注.
基于冗余字典的信号稀疏表示方法最早由
Mallat
和
Zha
吨提出,一个可压缩信号在某一空间上
可用极少的观测样本信号以高概率重构.基于信号的
稀疏表示进行信号压缩、图像增强、语音增强、人脸识
别等信号处理[
4-6J
已取得了较好的成果.稀疏表示方
法主要分为两个部分,冗余字典的构建和目标函数的
优化
.Zhang
等的通过实验证明,稀疏表示方法改善信
号处理性能的关键在于冗余字典的构建.目前主要有
2
种字典构建方法:固定字典法和字典训练法
[8-IOJ
但
这两种方法训练出的字典前者对信号的自适应性不
佳,后者结构松散,字典规模受限,且运算量大.
为了解决上述问题,
Rubinstein
等[lI
J
提出了一种新
的字典学习方法一
-Sparse
K-SVD
算法,对冗余字典
D
进一步进行稀疏分解,使用小波变换或离散余弦变换
建立一个基字典
B
,
并寻找一个稀疏表示系数矩阵
A
,
使得
D=BA.Sparse
K-SVD
算法通过对字典的稀疏表
示,使得字典
D
具有良好的自适应性,同时降低了字典
收稿日期
:2013-04-26
铃通信作者:
lilin@xmu.edu.cn
文章编号
:0438-0479(2014)01-0036-05
构建的计算复杂度,能够得到一个结构紧密的字典,利
于进行更高维度、更大规模信号的稀疏表示.
本文提出一种基于稀疏表示的语音增强算法,采
用
Sparse
K
-SVD
算法训练自适应的冗余字典,再应
用正交匹配追踪
(OMP)
算法进行稀疏编码来重构纯
净语音.在主观质量和客观指标上,基于稀疏表示的语
音增强方法(分别使用
Sparse
K
-SVD
算法和
K-SVD
算法训练字典)比传统语音增强方法(小波法、谱减
法、改进谱减法)获得更优的性能.在字典训练时间方
面进行分析发现,相对于
K-SVD
字典训练算法,
Sparse
K-SVD
算法大幅度提高了计算效率.
1
语音信号的稀疏表示原理
任意长度为
N
的一维离散语音信号
YξRN
,通
过冗余字典
D
εR
NXK
可稀疏表示为:
K
Y=D
α
=~d
山,
(1)
式中
=α
为信号的稀疏表示系数,为
KXl
的向量
,
d
k
为给定冗余字典
D
中的一个原子,的为
α
向量中与
d
k
相对应的值.语音信号的稀疏表示是从冗余字典中
选择具有最佳线性组合的若干原子来表示信号,实际
上是一种逼近过程.从稀疏逼近角度出发,希望在逼近
残差达到最小的情况下得到
α
最稀疏的一个解.这等
同于解决下述问题
[12J
â =
argminllα110
,使得
Ily-
~d
山
11:
~
ê ,
(2)