GMM-SVM混合模型在说话人识别中的应用

需积分: 0 152 浏览量更新于2024-08-05 收藏 140KB PDF 举报

"该资源是一篇关于GMM-SVM混合说话人识别模型的研究论文，由冷自强、王金明和林大会合作完成，主要探讨如何通过结合GMM（高斯混合模型）和SVM（支持向量机）的优势来提高说话人识别的性能。论文在TIMIT数据库上进行了实验，验证了该混合模型相对于传统GMM和SVM模型的优越性。" 在语音识别领域，说话人识别是一项关键任务，旨在识别说话人的身份。传统的说话人识别方法通常基于声学特征，如MFCC（梅尔频率倒谱系数），通过建模说话人的语音特性来区分不同的说话者。GMM是一种常用的统计建模工具，它假设语音特征是来自多个高斯分布的混合，并且每个说话人对应一组不同的混合成分。支持向量机（SVM）是一种监督学习模型，擅长处理小样本数据集，并在分类问题中表现出色。然而，当面临大量样本时，SVM的训练过程可能会变得非常复杂和耗时。为了解决这个问题，论文提出了将GMM与SVM相结合的混合模型。在特征参数域和概率得分域进行融合，意味着模型不仅利用了SVM的分类能力，还利用了GMM对概率分布的建模能力。在GMM-SVM模型中，SVM的概率输出被设计为包含说话人模型内部和模型之间的信息，这样可以更全面地考虑语音特征和说话人的关联。通过这种方式，模型能够更好地捕获说话人的独特性，同时减轻了SVM在大数据集上的训练难题。实验部分，研究人员使用了TIMIT数据库，这是一个广泛用于说话人识别研究的标准数据集。实验结果显示，提出的GMM-SVM模型在说话人识别性能上优于单独的GMM模型和SVM模型，这表明混合模型能够提供更准确的识别率，尤其在处理复杂的识别场景时。总结来说，这篇论文提出的GMM-SVM混合模型为说话人识别提供了一个新的视角，通过结合两种模型的优点，提高了识别效率和准确性，这对于实际应用中的语音识别系统有着重要的理论和实践意义。其工作也强调了在模型融合方面的创新，对于未来的研究提供了有价值的参考。

一种

GM M

SV M

混合说话人辨认模型

冷自强

, 王金明

, 林大会

( 1.解放军理工大学通信工程学院研究生 1队 , 江苏南京 210007;

2.解放军理工大学通信工程学院电子信息工程系; 3.解放军理工大学通信工程学院研究生 3队 )

摘　要:

文中提出了一种 GM M 和 SV M 混合说话人识别模型 ,在特征参数域和概率得分域对两种模型进

行了融合。混合模型结合了

GM M

和

SV M

各自的优势 ,使

SV M

的概率输出兼顾各说话人模型内部和模型之间

的信息 ,并有效解决了 SV M 训练算法复杂 ,难以处理大量样本的问题。采用 T IM I T 数据库进行了说话人辨认实

验 ,结果证明本文提出的

GM M

SV M

模型比传统的

GM M

模型和

SV M

模型具有更好的辨识性能。

关键词:

说话人辨认 ; 支持向量机 ; 高斯混合模型

中图分类号: TN 912 文献标识码: B 文章编号: CN 32-1289( 2009) 01-0086-04

Speaker Identifica tion Model Based on GMM -SVM

LEN G Zi -qiang

, W AN G Jin -m ing

, L IN Da -hui

( 1. Postg raduate T ea m 1 ICE, P L AU S T, Na njing 210007, China;

Depa rtme nt o f Elect ro nic Info rma tio n Engineering ICE

PL A U ST

; 3.

Po stg radua te Team

ICE

PL A U ST

)

Abstract

A hy brid speaker recog nition model based o n GM M a nd SV M w as presented

GM M and SVM were mi xed i n both feat ure parameter and li kelihood sco re dom ai n

The new

m odel combined the adv antag es of GM M and SV M, m aking the SVM output pro babili ties co ntain

bo th the info rm atio n i nside and betw een t he speaker models. The problem tha t SVM training al-

g orithm is too co mplex to deal w ith la rge number of training da ta w as resolved

The G MM

SV M

m odel was tested on the TIM I T database a nd show ed bett er perf orm ance than GM M and SVM

Key word s: speaker identifi cati on; suppo rt vecto r machi ne; Gaussian mix ture model

说话人识别是利用语音信号中包含的说话人个性信息 ,对其身份进行识别的技术。说话人识别可分为

辨认和确认 ,辨认是对一段未知出处的语音 ,从已有说话人模型集合中找出与之匹配最佳的模型 ,是多选一

问题 ;而后者是针对未知出处的语音 ,与其声称的说话人模型进行匹配 ,做出“是”或“不是”的判断 ,是二选一

问题。

目前有两种比较流行的说话人识别模型 ,一种是概率统计模型 ,如高斯混合模型 ( GM M )和隐马尔可夫

模型 (

HM M

); 另一种是基于判决的模型 ,如人工神经网络 (

AN N

)和支持向量机 (

SVM

)。两种模型各有特

点 ,概率统计模型从统计的角度充分表示了数据的分布情况 ,反映的是同类数据本身的相似度特性; 而判决

模型利用训练数据的类别标识信息 ,反映的是不同类数据之间的差异。判决模型往往要比概率统计模型的

性能稍好一些 ,但其缺点是不能反映训练数据本身的特性。文献 [1]中的研究表明 GM M 和 SVM 在同样的

训练数据上识别错误有很大不同 ,这说明二者有互补的方面。因此若说话人识别系统能结合二者的优点 ,将

会在一定程度上提高识别率。

实际应用时 ,支持向量机

[2 ]

的训练算法复杂 ,计算量大 ,难以处理大量样本数据。有实验表明 ,当训练样

第 30 卷第 1期

2009年 3月

军　事　通　信　技　术

Jo ur nal of M ilitar y Com munica tions Technolog y

V o l. 30 No. 1

M ar. 2009

收稿日期: 2008-04-30; 修回日期: 2008-10-28

作者简介: 冷自强 ( 1984- ) ,男 , 硕士生 .

下载后可阅读完整内容，剩余3页未读，立即下载

章满莫

粉丝: 35
资源: 316

GMM-SVM混合模型在说话人识别中的应用

基于高斯混合模型（GMM）的说话人识别matlab.zip_calcpost_gmm 训练_混合高斯模型_话者识别_高斯混合模型

kld_GMM_SVM.ppt

SVM.rar_gmm svm 代码_svm c代码_svm分类器_svm分类器用法

详细讲讲pickle.dump(gmm, gmm_file)

介绍一下GMM声学模型与GMM-UBM模型与原理，1000字

鸢尾花数据聚类分析 1、 数据集导入 2、 构建聚类模型可以采用Kmeans及GMM，并训练 3、 输出聚类标签 4、 查看聚类中心或混合成分参数，分析并对比聚类效果。 即聚类的各类别是否反应其真实所属。

如何用GMM-UBM模型识别说话人的年龄

用matlab写一段GMM聚类算法

gmm 高斯混合模型 stata

基于gmm的说话人识别

最新资源

鸢尾花数据聚类分析 1、数据集导入 2、构建聚类模型可以采用Kmeans及GMM，并训练 3、输出聚类标签 4、查看聚类中心或混合成分参数，分析并对比聚类效果。即聚类的各类别是否反应其真实所属。