声纹识别技术：MFCC特征提取的深入探究

需积分: 10 33 浏览量更新于2024-08-12 收藏 624KB PDF 举报

"声纹识别特征MFCC的提取方法研究" 本文主要探讨了声纹识别技术中一种关键的特征提取方法——梅尔频率倒谱系数（MFCC），以及其在提高声纹识别准确率方面的作用。作者王华朋和杨洪臣来自中国刑事警察学院公安视听技术系，他们通过实验研究证明，使用MFCC作为特征参数能够显著提升声纹识别的正确率。声纹识别是一种基于个人独特的声音模式来辨识个体身份的生物识别技术，尤其在安全性验证领域具有广泛应用前景。与其他生物识别技术如指纹、人脸和虹膜识别相比，声纹识别具有操作简便、非接触性以及相对经济的优势。在声纹识别系统中，特征提取和模式匹配是两个核心步骤。特征提取是选择出能唯一标识说话人身份的稳定特征，而模式匹配则是比较训练和鉴别阶段的特征模式，以确定相似度。MFCC作为一种符合人耳听觉特性的语音特征参数，被广泛用于声纹识别的特征提取阶段。预处理是特征提取的先决条件，包括语音信号的数字化、去噪、预加重等步骤。预加重能提升语音信号的高频成分，减少低频干扰，并有助于去除直流漂移和噪声。之后，通过短时能量和短时过零率检测，可以去除静默、噪声和清音帧，保留浊音信号，这部分信号对于计算MFCC等特征参数至关重要。在特征提取阶段，MFCC的计算涉及到对语音信号的分帧、加窗、梅尔滤波、倒谱变换和离散余弦变换等一系列操作。这些步骤旨在模拟人耳对不同频率敏感度的变化，提取出更能代表语音特征的参数。MFCC不仅考虑了频率成分，还考虑了时间上的变化，因此能够捕捉到说话人的独特声纹特征。实验结果显示，使用MFCC作为特征参数进行声纹识别，相比于使用线性预测编码（LPC）等其他特征参数，识别正确率有显著提高。这表明MFCC在声纹识别技术中具有较高的实用价值和有效性。 MFCC的提取方法在声纹识别中扮演着至关重要的角色，它能够有效提取出反映说话人独特生理和行为特征的语音参数，从而提高识别系统的性能。随着技术的进步，声纹识别技术有望在安全、法律、通信等多个领域发挥更大的作用。

　　作者简介　王华朋

(

1979—　

)

, 男 , 山东人 , 助教。

2008年第 1期 No11 2008　 Journal of Chinese Peopleπs Public Security University

(

Science and Technology

)

　总第 55期 Sum55

声纹识别特征 MFCC的提取方法研究

王华朋 , 杨洪臣

(

中国刑事警察学院公安视听技术系 , 辽宁沈阳　110035

)

摘　要　目的 : 研究声纹识别在人的个体生物特征识别中的应用。方法 : 利用符合人听觉特性的

语音特征参量 MFCC作为识别特征 , 并且在 Matlab平台上对 MFCC的提取算法进行了详细的阐

述和程序设计。结果 : 在实际应用中取得了较高的识别率。结论 : 采用 MFCC作为特征参数进行

声纹识别 , 其正确率比用 LPC等作为特征参数有较大的改善。

关键词　声纹识别 ; MFCC; 特征提取

中图分类号　D91819　　　

0　引言

随着社会的发展 , 安全问题日趋重要。用人类

生物特征

(

声纹、指纹、人脸、虹膜

)

并结合计

算机技术进行安全验证是当今的热门课题。声纹识

别技术是生物识别技术的一种 , 与其他生物识别技

术相比 , 声纹识别具有更为简便、准确、经济及非

接触性识别等众多优势。

声纹识别是一项根据声纹中反映说话人生理和

行为特征的语音参数 , 自动识别说话人身份的技

术。声纹识别过程中最主要的两部分内容是特征提

取和模式匹配。特征提取 , 就是从声音中选取唯一

表现说话人身份的有效且稳定可靠的特征 ; 模式匹

配就是对训练和鉴别时的特征模式做相似性匹配。

基于人耳听觉特性的语音特征 Mel频率倒谱系数

(

Mel frequency cep strum coefficient, MFCC

)

, 可以

作为声纹识别的重要特征参数之一。

1　语音特征参数的提取

111　预处理

对模拟语音信号进行量化和采样 , 获得数字化

的语音信号 ; 再将含噪的语音信号通过去噪处理 ,

得到干净的语音信号后并通过预加重技术滤除低频

干扰 , 尤其是 50Hz或 60Hz的工频干扰 , 提升语

音信号的高频部分 , 而且它还可以起到消除直流漂

移、抑制随机噪声和提升清音部分能量的作用。降

噪后 , 通过对语音信号的短时能量和短时过零率检

测可以剔除掉静默帧、白噪声帧和清音帧 , 最后保

留对求取基音、LPCC、MFCC等特征参数非常有

用的浊音信号。

112　特征提取

在语音信号预处理后 , 接着是特征参数的提

取。特征提取的任务就是提取语音信号中表征人的

基本特征。选取的特征必须能够有效地区分不同的

说话人 , 且对同一说话人的变化保持相对稳定。语

音的特征提取本质上是起降维作用 , 用较少的维数

表现了说话人的特征。常用的语音特征包括基于发

声器官如声门、声道和鼻腔的生理结构而提取的参

数 , 如谱包络、基音、共振峰等。基于声道特征模

型 , 通过线性预测分析得到的参数 , 如线性预测倒

谱系数

(

LPCC

)

、LSP线谱对、线性预测残差等。

基于人耳的听觉机理 , 反映听觉特性 , 模拟人耳对

声音频率感知的特征参数 , 如美尔倒谱系数

(

MF2

)

等。

通过研究 , 人们发现人耳对不同频率的语音具

有不同的感知能力 , 这个感知能力并不是随着频率

的增加而线性增加。通过大量的实验 , 人们根据人

耳在不同频率下的音调感知能力 , 提出了 Mel频率

·82·

中国人民公安大学学报

(

自然科学版

)

下载后可阅读完整内容，剩余3页未读，立即下载

?c.k

粉丝: 0
资源: 5

声纹识别技术：MFCC特征提取的深入探究

（前面部分内容可以参考）声纹识别技术及其应用前景分析.pdf

论文研究-语音信号特征提取中Mel倒谱系MFCC的改进算法.pdf

Android平台声纹解锁系统的仿真与研究.pdf

基于大津算法和深度学习的开集声纹识别自适应阈值计算方法.pdf

深度学习说话人识别中语音特征参数提取研究.pdf

Android平台下结合GPS与声纹识别的考勤研究.pdf

基于FPGA的语音MFCC参数提取.pdf

一种改进的LBG算法在声纹识别中的应用.pdf

基于深度学习的帕金森患者声纹识别.pdf

行业分类-物理装置-一种声纹数据库建立方法及声纹识别方法.zip

最新资源