实时声纹识别：VQ+GMM双层模型优化

需积分: 0 38 浏览量更新于2024-08-05 收藏 577KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

资源详情

资源推荐

计算机系统应用 http://www.c-s-a.org.cn 2014 年第 23 卷第 9 期

专论·综述

Special Issue

基于 VQ 和 GMM 的实时声纹识别研究

①

鲁晓倩, 关胜晓

(中国科学技术大学信息科学技术学院, 合肥 230027)

摘要: 目前声纹识别系统已经实现较高的识别精度, 但是随着目标说话人个数的增加, 一般系统很难满足实时

性的要求, 由此提出一种双层识别模型. 在第一层识别模型中, 采用基于 VQ-VPT(Vector Quantization-Vantage

Point Tree)模型进行快速匹配, 挑选出与测试者声纹特征最相近的 K 个目标说话人声纹模型. 在第二层识别模型

中, 采用 GMM-UBM(Gaussian Mixture Model-Universal Background Model)模型, 精确匹配上层模型得到的 K 个

目标说话人声纹模型, 并做出最终的判决. 实验验证, 双层识别模型在确保高识别精度的前提下, 大幅度的提高

了系统的识别速度.

关键词: 声纹识别; 矢量量化; 优势节点树; 高斯混合模型; 通用背景模型

Real-Time Voiceprint Recognition Based on VQ and GMM

LU Xiao-Qian, GUAN Sheng-Xiao

(School of Information Science and Technology, University of Science and Technology of China, Hefei 230027, China)

Abstract: At present, the voiceprint recognition system has achieved high identification precision. But with the increase

of the number of target speakers, general system has difficulty in satisfying the need of real time. Therefore, a two-layer

recognition model is raised in this paper. The first layer based on VQ -VPT model quickly sorts out K target speakers’

voiceprint models which are most similar to the speaker’s voiceprint characteristics. In the second layer, the

GMM-UBM model matches the K voiceprint models to make a final judgment. Via experimental verification, under the

premise of ensuring high recognition accuracy, the two-layer recognition model has greatly improved the recognition

speed of the system.

Key words: voiceprint recognition; vector quantization (VQ); vantage point tree (VPT); gaussian mixture model

(GMM); universal background model (UBM)

声纹识别

[1]

(Voiceprint Recognition)技术属于生物

认证技术的一种, 是通过人的说话声音来辨识说话人

身份的技术. 与指纹识别、文字密码、人脸识别等其

它认证技术相比, 声纹识别具有不会遗失、无需要记

忆、实现简单等特点, 是一种非接触识别方式.

1962 年 L.G. Kesta 首次介绍了采用声纹进行识别

的可行性. Bell 实验室最先采用了模板匹配的方式进

行声纹识别. 1969 年 Luck JE 提出了采用倒谱的方式

进行识别, 其实验结果较为理想. BS Atal 采用线性预

测倒谱的方式进行说话人识别. 1972 年 Atal 提出了采

① 通讯作者:关胜晓 Email:guanxiao@ustu.edu.cn

收稿时间:2014-01-03;收到修改稿时间:2014-03-03

用基频轮廓的方式进行声纹识别, 该种方式将数字信

号处理相关的技术应用到声纹识别中, 可以从语音信

号中提取出间接反映说话人特征的一些参数.

20 世纪 70 年代末到 90 年代, 声纹识别的重点研

究领域为模式识别算法, 动态时间规整、矢量量化、

隐马尔科夫模型、人工神经网络等逐渐得到广泛应用.

90 年代以后, 高斯混合模型因其简单有效且具有较好

的噪声鲁棒性成为声纹识别的主流技术, 将声纹识别

引入新的发展阶段. 2000 年以后, Reynolds 提出高斯混

合模型-通用背景模型, 降低了说话人模型对训练集合

下载后可阅读完整内容，剩余6页未读，立即下载

lowsapkj

粉丝: 210
资源: 312

实时声纹识别：VQ+GMM双层模型优化

基于VQ和GMM的双层声纹识别算法1

Matlab平台基于VQ的语者识别系统

基于VQ的说话人识别系统设计

基于矢量量化（VQ）的说话人识别

基于 VQ 的说话人识别的python代码

如何用matlab实现基于VQ特定人孤立词语音识别

GMM聚类算法国内外研究现状

语音识别VQ算法的缺点

matlab语音识别vq码本和mfcc

matlab编写vq实现语音分类

a3p250-vq100优点

h265码流分析工具vq analyzer下载

您好，电压源型逆变器的Vd 和Vq

vcs vq-2020.03

scipy.cluster.vq

VAE 和 VQ-VAE 的区别是什么？

yq=ones(m,1)*y; vq=yq-q*ones(1,length(w)); bj=abs(vq); ai=1;

a3p250-vq100

matlab中vq函数

smc vq100 底座安装尺寸

最新资源

yq=ones(m,1)y; vq=yq-qones(1,length(w)); bj=abs(vq); ai=1;