没有合适的资源?快使用搜索试试~ 我知道了~
首页多核SVM_GMM提升短语音说话人识别性能
多核SVM_GMM提升短语音说话人识别性能
需积分: 0 0 下载量 17 浏览量
更新于2024-08-05
收藏 721KB PDF 举报
本文主要探讨了基于多核支持向量机(SVM)和高斯混合模型(GMM)的短语音说话人识别方法。作者林琳、陈虹、陈建和金焕梅针对传统的单核SVM在处理语音识别中的局限性,提出了一种创新的策略。他们通过在多核空间中构建说话人分类器,利用线性组合的多个核函数来增强语音特征的表达能力和区分度,从而提高识别的准确性和鲁棒性。 在传统SVM中,单一核函数的选择和参数设置可能会影响识别效果。多核映射技术解决了这一问题,它允许使用不同的核函数,如径向基函数(RBF)、多项式核或sigmoid核等,通过组合的方式优化识别性能。这种方法不仅增加了模型的灵活性,还能更好地适应不同类型的语音数据。 作者将高斯混合模型引入到该体系中,因为GMM是一种强大的概率模型,能有效地对说话人的声音特征进行建模。通过将GMM的超向量作为说话人的最终特征,算法可以更精确地捕捉说话人的独特声学特性。在实际的仿真实验中,研究者对比了基于多核SVM-GMM的算法与单纯使用SVM-GMM的方法,结果显示在短语音识别任务中,特别是在噪声环境下,多核SVM-GMM表现出了更高的识别精度和更强的抗干扰能力。 这篇文章关注的核心知识点包括多核SVM的原理和应用、高斯混合模型在语音特征提取中的作用、以及如何通过这些技术改进短语音说话人识别系统的性能。这项工作对于提升语音识别系统的实用性和鲁棒性具有重要意义,为实际应用提供了新的研究方向和技术支持。
资源详情
资源推荐
书书书
第
43
卷
第
2
期
吉 林 大 学 学 报
(
工 学 版
)
Vol.43
No.2
2013
年
3
月
Journal
of
Jilin
Universit
y
(
En
g
ineerin
g
and
Technolo
gy
Edition
)
Mar.2013
收稿日期
:
2012
-
05
-
10.
基金项目
:
吉林省科技发展计划项目
(
201101032
);
高等学校博士学科点专项科研基金项目
(
20090061120042
)
.
作者简介
:
林琳
(
1979a2
),
女
,
讲师
,
博士
.
研究方向
:
语音信号处理
,
模式识别
.E
-
mail
:
lin
_
lin
@
j
lu.edu.cn
通信作者
:
陈建
(
1977a2
),
男
,
讲师
,
博士
.
研究方向
:
数字信号处理
,
阵列信号处理
.E
-
mail
:
chen
j
ian
@
j
lu.edu.cn
基于多核
SVM
-
GMM
的短语音说话人识别
林
琳
,
陈
虹
,
陈
建
,
金焕梅
(
吉林大学 通信工程学院
,
长春
130022
)
摘
要
:
运用多个核函数的线性组合构造多核空间
,
在多核空间上设计了基于支持向量机的说
话人分类器
,
实现短语音说话人识别
。
多核映射能够解决单核映射核函数及其参数选择的难
题
,
增加说话人的可区分性
,
提高分类器的性能
。
算法中结合了高斯混合模型
(
GMM
),
并以
GMM
超向量作为说话人的最终特征参数进行仿真实验
。
实验表明
,
在短语音和两种噪声环
境中
,
基于多核
SVM
-
GMM
的短语音说话人识别算法较
SVM
-
GMM
算法能得到更好的识别
性能和鲁棒性
。
关键词
:
通信技术
;
说话人识别
;
短语音
;
多核支持向量机
;
高斯混合模型超向量
中图分类号
:
TN912.3
文献标志码
:
A
文章编号
:
1671
-
5497
(
2013
)
02
-
0504
-
06
S
p
eaker
reco
g
nition
with
short
utterances
based
on
multi
p
le
kernel
SVM
-
GMM
LIN
lin
,
CHEN
Hon
g
,
CHEN
Jian
,
JIN
Huan
-
mei
(
Colle
g
e
o
f
Communication
En
g
ineerin
g
,
Jilin
Universit
y
,
Chan
g
chun
130022
,
China
)
Abstract
:
A
linear
combination
of
several
kernels
is
used
to
construct
multi
p
le
kernel
s
p
ace.In
multi
p
le
kernel
s
p
ace
,
Su
pp
ort
Vector
Machine
(
SVM
)
classifiers
are
desi
g
ned
to
identif
y
s
p
eakers
with
short
utterances.Multi
p
le
kernel
ma
pp
in
g
can
solve
the
p
roblem
of
sin
g
le
kernel
ma
pp
in
g
,
such
as
the
selection
of
kernel
function
and
p
arameters. Besides
,
multi
p
le
kernel
ma
pp
in
g
can
increase
discriminative
p
ower
amon
g
different
s
p
eakers
and
im
p
rove
the
p
erformance
of
classifiers.In
simulation
ex
p
eriment
,
Gaussian
Mixture
Model
(
GMM
)
was
used
to
g
et
GMM
su
p
ervector
as
s
p
eakers'final
feature
p
arameters.Ex
p
eriment
results
show
that
under
the
condition
of
short
utterances
and
two
nois
y
environments
,
the
p
erformance
and
robustness
of
the
multi
p
le
SVM
-
GMM
s
p
eaker
reco
g
nition
al
g
orithm
are
better
than
that
of
SVM
-
GMM
al
g
orithm.
Ke
y
words
:
communication
;
s
p
eaker
reco
g
nition
;
short
utterances
;
multi
p
le
kernel
SVM
;
Gaussian
mixture
model
su
p
ervector
说话人识别是一种以说话人语音对说话人进
行区分
,
从而进行身份鉴别与验证的技术
。
为了
达到令人满意的效果
,
大多数说话人识别系统在
建立话者模型时仍然需要较长的语音文本和大量
的训练数据
,
尽管可以利用各种算法来减少系统
的识别时间
,
达到实用化
,
但是对于那些只能获得
少量说话人语音数据的应用场合
,
这些系统就无
能为力了
。
因此
,
利用短语音文本以及尽可能少
DOI:10.13229/j.cnki.jdxbgxb2013.02.033
下载后可阅读完整内容,剩余5页未读,立即下载
不美的阿美
- 粉丝: 23
- 资源: 292
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 构建Cadence PSpice仿真模型库教程
- VMware 10.0安装指南:步骤详解与网络、文件共享解决方案
- 中国互联网20周年必读:影响行业的100本经典书籍
- SQL Server 2000 Analysis Services的经典MDX查询示例
- VC6.0 MFC操作Excel教程:亲测Win7下的应用与保存技巧
- 使用Python NetworkX处理网络图
- 科技驱动:计算机控制技术的革新与应用
- MF-1型机器人硬件与robobasic编程详解
- ADC性能指标解析:超越位数、SNR和谐波
- 通用示波器改造为逻辑分析仪:0-1字符显示与电路设计
- C++实现TCP控制台客户端
- SOA架构下ESB在卷烟厂的信息整合与决策支持
- 三维人脸识别:技术进展与应用解析
- 单张人脸图像的眼镜边框自动去除方法
- C语言绘制图形:余弦曲线与正弦函数示例
- Matlab 文件操作入门:fopen、fclose、fprintf、fscanf 等函数使用详解
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功