收稿日期: 20070620
作者简介: 杨洁( 1979- ), 女, 硕士, 研究实习员。主要研究领域为信号处理、农业数字化, 农业遥感。
文章编号: 10024026( 2008) 04005705
与文本无关的说话人识别系统的设计与实现
杨洁
1
, 张勇
2
( 1. 山东省农业科学院可持续发展研究所, 山东 济南 250100; 2. 山东省农业科学院, 山东 济南 250100)
摘要: 在虚拟仪器平台上, 通过微型麦 克与计算 机声卡对语音 信号进 行实时采集, 并进行 消噪处 理和端点检
测, 以美尔频率倒谱系数及其差分作为特征参数提取方法, 应用改进的矢量量化- 隐马尔可夫识别算法, 设计
了与文本无关的说话人识别系统。系统运行结果表明, 本文实现的系统运算速度快, 且具有较高的识别率。
关键词: 美尔倒谱系数; 改进的矢量量化- 隐马尔可夫算 法; 文本无关; 说话人识别; 虚拟仪器
中图分类号: TN912. 34 文献标识码: A
Th e Design and Implementation of Textindependent
Speaker Identification System
YANG Jie
1
, ZHANG Yong
2
( 1. Institute of Agriculture Sustainable Development , Shandong Academy of Agricultural Sciences ,
Jinan 250100, China; 2. Shandong Academy of Agricultural Sciences, Jinan 250100, China)
Abstract: A microphone and a computer sound card are employed to acquire realtime speech signals and
perform noise suppression and endpoint detection on a LABVIEW platform. By using the Mel Frequency
Cepstrum Coefficient , speaker recognition s characteristic parameter is extracted. The textindependent
speaker identification system is designed through Improved VQ ( V ector Quant ization)HMM ( Hidden
Markov Model) algorithm. The results show that it has high computation speed and higher recognition
rate.
Key words: MFCC; improved VQHMM algorithm; textindependent; speaker identification; LABVIEW
语音是人类进行相互通信和交流的最方便、快捷的手段。在高度发达的信息社会中, 用数字化的方法进
行语音的传送、储存、识别、合成、增强等是整个数字化通信网中最重要、最基本的组成部分之一
[ 1]
。说话人
识别是根据人的语音信号来识别人的一种生物认证技术, 在金融、国家安全、司法、电子商务、电子政务等应
用领域具有特殊的现实意义。
LabVIEW 语言
[ 2]
是美国国家仪器公司( National Instruments, NI) 的创新软件产品, 是一种功能强大的图形
化编程语言, 可提供与真实仪器相似的用户界面, 使用数据流编程方法来描述程序的执行, 用图标和连线代
替文本的形式编写程序。该系统带有专业的数学分析程序包, 能够运用一般的数学运算、逻辑运算和输入输
出功能, 基本上可满足复杂的工程计算和分析要求
[ 2]
。
本文在 LabVIEW 平台, 选用以人耳的听觉频率非线性感知特性作为特征参数的提取方法和改进的矢量
量化- 隐马尔可夫识别算法, 构建了与传统仪器相似的用户界面的文本无关说话人辨认系统, 运算速度快且
具有较高的识别率。
第 21 卷 第 4 期
2008 年8 月
山 东 科 学
SHANDONG SCIENCE
Vol. 21 No. 4
Aug. 2008