多核SVM_GMM提升短语音说话人识别性能

需积分: 0 165 浏览量更新于2024-08-05 收藏 721KB PDF 举报

本文主要探讨了基于多核支持向量机（SVM）和高斯混合模型（GMM）的短语音说话人识别方法。作者林琳、陈虹、陈建和金焕梅针对传统的单核SVM在处理语音识别中的局限性，提出了一种创新的策略。他们通过在多核空间中构建说话人分类器，利用线性组合的多个核函数来增强语音特征的表达能力和区分度，从而提高识别的准确性和鲁棒性。在传统SVM中，单一核函数的选择和参数设置可能会影响识别效果。多核映射技术解决了这一问题，它允许使用不同的核函数，如径向基函数（RBF）、多项式核或sigmoid核等，通过组合的方式优化识别性能。这种方法不仅增加了模型的灵活性，还能更好地适应不同类型的语音数据。作者将高斯混合模型引入到该体系中，因为GMM是一种强大的概率模型，能有效地对说话人的声音特征进行建模。通过将GMM的超向量作为说话人的最终特征，算法可以更精确地捕捉说话人的独特声学特性。在实际的仿真实验中，研究者对比了基于多核SVM-GMM的算法与单纯使用SVM-GMM的方法，结果显示在短语音识别任务中，特别是在噪声环境下，多核SVM-GMM表现出了更高的识别精度和更强的抗干扰能力。这篇文章关注的核心知识点包括多核SVM的原理和应用、高斯混合模型在语音特征提取中的作用、以及如何通过这些技术改进短语音说话人识别系统的性能。这项工作对于提升语音识别系统的实用性和鲁棒性具有重要意义，为实际应用提供了新的研究方向和技术支持。

书书书

第

４３

卷

第

２

期

吉林大学学报

（

工学版

）

Ｖｏｌ．４３

Ｎｏ．２

２０１３

年

３

月

Ｊｏｕｒｎａｌ

ｏｆ

Ｊｉｌｉｎ

Ｕｎｉｖｅｒｓｉｔ

ｙ

（

Ｅｎ

ｇ

ｉｎｅｅｒｉｎ

ｇ

ａｎｄ

Ｔｅｃｈｎｏｌｏ

ｇｙ

Ｅｄｉｔｉｏｎ

）

Ｍａｒ．２０１３

收稿日期

：

２０１２

－

０５

－

１０．

基金项目

：

吉林省科技发展计划项目

（

２０１１０１０３２

）；

高等学校博士学科点专项科研基金项目

（

２００９００６１１２００４２

）

．

作者简介

：

林琳

（

１９７９ａ２

），

女

，

讲师

，

博士

．

研究方向

：

语音信号处理

，

模式识别

．Ｅ

－

ｍａｉｌ

：

ｌｉｎ

＿

ｌｉｎ

＠

ｊ

ｌｕ．ｅｄｕ．ｃｎ

通信作者

：

陈建

（

１９７７ａ２

），

男

，

讲师

，

博士

．

研究方向

：

数字信号处理

，

阵列信号处理

．Ｅ

－

ｍａｉｌ

：

ｃｈｅｎ

ｊ

ｉａｎ

＠

ｊ

ｌｕ．ｅｄｕ．ｃｎ

基于多核

ＳＶＭ

－

ＧＭＭ

的短语音说话人识别

林

琳

，

陈

虹

，

陈

建

，

金焕梅

（

吉林大学通信工程学院

，

长春

１３００２２

）

摘

要

：

运用多个核函数的线性组合构造多核空间

，

在多核空间上设计了基于支持向量机的说

话人分类器

，

实现短语音说话人识别

。

多核映射能够解决单核映射核函数及其参数选择的难

题

，

增加说话人的可区分性

，

提高分类器的性能

。

算法中结合了高斯混合模型

（

ＧＭＭ

），

并以

ＧＭＭ

超向量作为说话人的最终特征参数进行仿真实验

。

实验表明

，

在短语音和两种噪声环

境中

，

基于多核

ＳＶＭ

－

ＧＭＭ

的短语音说话人识别算法较

ＳＶＭ

－

ＧＭＭ

算法能得到更好的识别

性能和鲁棒性

。

关键词

：

通信技术

；

说话人识别

；

短语音

；

多核支持向量机

；

高斯混合模型超向量

中图分类号

：

ＴＮ９１２．３

文献标志码

：

Ａ

文章编号

：

１６７１

－

５４９７

（

２０１３

）

０２

－

０５０４

－

０６

Ｓ

ｐ

ｅａｋｅｒ

ｒｅｃｏ

ｇ

ｎｉｔｉｏｎ

ｗｉｔｈ

ｓｈｏｒｔ

ｕｔｔｅｒａｎｃｅｓ

ｂａｓｅｄ

ｏｎ

ｍｕｌｔｉ

ｐ

ｌｅ

ｋｅｒｎｅｌ

ＳＶＭ

－

ＧＭＭ

ＬＩＮ

ｌｉｎ

，

ＣＨＥＮ

Ｈｏｎ

ｇ

，

ＣＨＥＮ

Ｊｉａｎ

，

ＪＩＮ

Ｈｕａｎ

－

ｍｅｉ

（

Ｃｏｌｌｅ

ｇ

ｅ

ｏ

ｆ

Ｃｏｍｍｕｎｉｃａｔｉｏｎ

Ｅｎ

ｇ

ｉｎｅｅｒｉｎ

ｇ

，

Ｊｉｌｉｎ

Ｕｎｉｖｅｒｓｉｔ

ｙ

，

Ｃｈａｎ

ｇ

ｃｈｕｎ

１３００２２

，

Ｃｈｉｎａ

）

Ａｂｓｔｒａｃｔ

：

Ａ

ｌｉｎｅａｒ

ｃｏｍｂｉｎａｔｉｏｎ

ｏｆ

ｓｅｖｅｒａｌ

ｋｅｒｎｅｌｓ

ｉｓ

ｕｓｅｄ

ｔｏ

ｃｏｎｓｔｒｕｃｔ

ｍｕｌｔｉ

ｐ

ｌｅ

ｋｅｒｎｅｌ

ｓ

ｐ

ａｃｅ．Ｉｎ

ｍｕｌｔｉ

ｐ

ｌｅ

ｋｅｒｎｅｌ

ｓ

ｐ

ａｃｅ

，

Ｓｕ

ｐｐ

ｏｒｔ

Ｖｅｃｔｏｒ

Ｍａｃｈｉｎｅ

（

ＳＶＭ

）

ｃｌａｓｓｉｆｉｅｒｓ

ａｒｅ

ｄｅｓｉ

ｇ

ｎｅｄ

ｔｏ

ｉｄｅｎｔｉｆ

ｙ

ｓ

ｐ

ｅａｋｅｒｓ

ｗｉｔｈ

ｓｈｏｒｔ

ｕｔｔｅｒａｎｃｅｓ．Ｍｕｌｔｉ

ｐ

ｌｅ

ｋｅｒｎｅｌ

ｍａ

ｐｐ

ｉｎ

ｇ

ｃａｎ

ｓｏｌｖｅ

ｔｈｅ

ｐ

ｒｏｂｌｅｍ

ｏｆ

ｓｉｎ

ｇ

ｌｅ

ｋｅｒｎｅｌ

ｍａ

ｐｐ

ｉｎ

ｇ

，

ｓｕｃｈ

ａｓ

ｔｈｅ

ｓｅｌｅｃｔｉｏｎ

ｏｆ

ｋｅｒｎｅｌ

ｆｕｎｃｔｉｏｎ

ａｎｄ

ｐ

ａｒａｍｅｔｅｒｓ．Ｂｅｓｉｄｅｓ

，

ｍｕｌｔｉ

ｐ

ｌｅ

ｋｅｒｎｅｌ

ｍａ

ｐｐ

ｉｎ

ｇ

ｃａｎ

ｉｎｃｒｅａｓｅ

ｄｉｓｃｒｉｍｉｎａｔｉｖｅ

ｐ

ｏｗｅｒ

ａｍｏｎ

ｇ

ｄｉｆｆｅｒｅｎｔ

ｓ

ｐ

ｅａｋｅｒｓ

ａｎｄ

ｉｍ

ｐ

ｒｏｖｅ

ｔｈｅ

ｐ

ｅｒｆｏｒｍａｎｃｅ

ｏｆ

ｃｌａｓｓｉｆｉｅｒｓ．Ｉｎ

ｓｉｍｕｌａｔｉｏｎ

ｅｘ

ｐ

ｅｒｉｍｅｎｔ

，

Ｇａｕｓｓｉａｎ

Ｍｉｘｔｕｒｅ

Ｍｏｄｅｌ

（

ＧＭＭ

）

ｗａｓ

ｕｓｅｄ

ｔｏ

ｇ

ｅｔ

ＧＭＭ

ｓｕ

ｐ

ｅｒｖｅｃｔｏｒ

ａｓ

ｓ

ｐ

ｅａｋｅｒｓ＇ｆｉｎａｌ

ｆｅａｔｕｒｅ

ｐ

ａｒａｍｅｔｅｒｓ．Ｅｘ

ｐ

ｅｒｉｍｅｎｔ

ｒｅｓｕｌｔｓ

ｓｈｏｗ

ｔｈａｔ

ｕｎｄｅｒ

ｔｈｅ

ｃｏｎｄｉｔｉｏｎ

ｏｆ

ｓｈｏｒｔ

ｕｔｔｅｒａｎｃｅｓ

ａｎｄ

ｔｗｏ

ｎｏｉｓ

ｙ

ｅｎｖｉｒｏｎｍｅｎｔｓ

，

ｔｈｅ

ｐ

ｅｒｆｏｒｍａｎｃｅ

ａｎｄ

ｒｏｂｕｓｔｎｅｓｓ

ｏｆ

ｔｈｅ

ｍｕｌｔｉ

ｐ

ｌｅ

ＳＶＭ

－

ＧＭＭ

ｓ

ｐ

ｅａｋｅｒ

ｒｅｃｏ

ｇ

ｎｉｔｉｏｎ

ａｌ

ｇ

ｏｒｉｔｈｍ

ａｒｅ

ｂｅｔｔｅｒ

ｔｈａｎ

ｔｈａｔ

ｏｆ

ＳＶＭ

－

ＧＭＭ

ａｌ

ｇ

ｏｒｉｔｈｍ．

Ｋｅ

ｙ

ｗｏｒｄｓ

：

ｃｏｍｍｕｎｉｃａｔｉｏｎ

；

ｓ

ｐ

ｅａｋｅｒ

ｒｅｃｏ

ｇ

ｎｉｔｉｏｎ

；

ｓｈｏｒｔ

ｕｔｔｅｒａｎｃｅｓ

；

ｍｕｌｔｉ

ｐ

ｌｅ

ｋｅｒｎｅｌ

ＳＶＭ

；

Ｇａｕｓｓｉａｎ

ｍｉｘｔｕｒｅ

ｍｏｄｅｌ

ｓｕ

ｐ

ｅｒｖｅｃｔｏｒ

说话人识别是一种以说话人语音对说话人进

行区分

，

从而进行身份鉴别与验证的技术

。

为了

达到令人满意的效果

，

大多数说话人识别系统在

建立话者模型时仍然需要较长的语音文本和大量

的训练数据

，

尽管可以利用各种算法来减少系统

的识别时间

，

达到实用化

，

但是对于那些只能获得

少量说话人语音数据的应用场合

，

这些系统就无

能为力了

。

因此

，

利用短语音文本以及尽可能少

DOI:10.13229/j.cnki.jdxbgxb2013.02.033

下载后可阅读完整内容，剩余5页未读，立即下载

不美的阿美

粉丝: 23
资源: 292

多核SVM_GMM提升短语音说话人识别性能

多核SVM_SVM分类python_多核SVM_

simplemulti-kernel-svm.rar_svm 多核_svm多核_多核SVM_多核matlab_多核学习 svm

svm.zip_SVM_SVM 说话识别_SVM语音识别_svm 说话人识别_说话人识别 svm

simpleMKL_svm多核_kernelsvm_tidezmk_多核SVM_多融合内核训练程序

simpleMKL_svm多核_kernelsvm_tidezmk_多核SVM_多融合内核训练程序_源码.rar

simpleMKL_svm多核_kernelsvm_tidezmk_多核SVM_多融合内核训练程序_源码.zip

MKL.rar_SVM分类_SVm遥感_matlab mkl_多核SVM_遥感

matlab.rar_LPCC的matlab实现_SVM 语音_mfcc svm c++_语音识别 svm_语音识别SVM

PCA-SVM.rar_PCA-SVM_人脸svm_人脸识别 SVM_人脸识别PCA_人脸识别svm

SVM_Classification_SVM_SVM识别_SVM鸢尾花分类_SVM分类_svm分类识别_源码.zip

最新资源