基于随机共振的改进MFCC说话人识别方法

需积分: 0 114 浏览量更新于2024-08-05 收藏 379KB PDF 举报

"说话人识别中改进的MFCC参数提取方法1" 在语音识别和说话人识别技术领域，特征参数的提取是至关重要的步骤。Mel频标倒谱系数（Mel Frequency Cepstral Coefficients，简称MFCC）是常用的一种特征提取方法，它模拟了人耳对声音的感知特性，能够有效地分析语音信号并滤除无关紧要的信息，保留对识别至关重要的特征。MFCC参数提取通常包括预加重、分帧、加窗、梅尔滤波、对数变换和离散余弦变换等步骤，这些步骤旨在提取出语音信号的频率包络，并将其转化为易于处理的系数。然而，由于语音信号的时变性和混沌特性，传统的MFCC方法可能无法完全捕捉到所有关键信息。为了提高识别效果，有研究者提出了基于随机共振的MFCC参数提取方法。随机共振是一种理论，它利用非线性系统对微弱信号的增强效应，特别适用于处理混沌或噪声环境下的信号。将随机共振理论应用于MFCC提取，可以更好地揭示语音信号的内在结构，增强特征的区分度。具体来说，该方法首先结合人耳听觉机理，考虑到人耳对不同频率的敏感程度，设计梅尔滤波器组来模拟这一特性。然后，利用随机共振原理对经过梅尔滤波的信号进行处理，这一步可以增强语音信号中的有用信息，同时抑制噪声。接下来，进行对数变换以线性化频谱，并应用离散余弦变换（DCT）将对数谱转换为MFCC系数，这些系数能够表征语音的主要特征。通过对标准MFCC方法和改进后的MFCC方法进行实验比较，研究表明，改进的方法在说话人识别任务中表现出更好的性能和鲁棒性。这表明，结合随机共振理论的MFCC提取方法可以作为说话人识别技术的一个新方向，有望进一步提升系统的识别准确率。关键词: 说话人识别、特征提取、MFCC参数、随机共振、语音信号处理这篇论文的研究成果受到国家科技计划基金和贵州省国际科技合作计划基金的支持，为语音信号处理，特别是说话人识别领域的研究提供了新的思路和方法。

第１１卷第１８期２０１１年６月

１６７ｌ一１８１５（２０１１）１８—４２１５—０５

科学技术与工程

Ｓｃｉｅｎｃｅ

Ｔｅｃｈｎｏｌｏｇｙ

ａｎｄ

Ｅｎｇｉｎｅｅｒｉｎｇ

ＶｏＬ

１１

Ｎｏ．１８

Ｊｕｎｅ

２０ｌｌ

＠２０１

１

Ｓｃｉ．Ｔｅｃｈ．Ｅｎｇｎｇ．

通信技术

说话人识别中改进的ＭＦＣＣ参数提取方法

何朝霞潘平

（贵州大学计算机科学与信息学院。贵阳５５００２３）

摘要在说话人识别技术中，特征参数的提取对语音训练和识别有着非常重要的作用。而Ｍｅｌ频标倒谱系数ＭＦＣＣ是一种

常用的特征，它能对语音信号进行分析处理，去除对语音识别无关紧要的冗余信息，获得影响语音识别的重要信息。同时由

于语音信号具有时变和混沌特性，以非线性随机共振理论和人类对听觉的理解为基础，提出了一种基于随机共振的ＭＦＣＣ特

征参数提取方法。通过实验比较两种方法的结果，论证了改进方法的可行性以及优越性，为说话人识别技术中特征参数提取

提供了一条新的研究方向。

关键词说话人识别

特征提取

ＭＦＣＣ参数

随机共振

中图法分类号ＴＮ９１２．３４；

文献标志码Ａ

语音特征提取是指从语音信号中获取一组能

够描述语音信号特征参数的过程。在理想情况下，

这些特征应该具有以下特点：相对保持稳定；不易

被模仿；尽量不随时间和空间变化等。ＭＦＣＣ参数

具有良好的识别性能和抗噪能力，在目前的语音识

别和说话人识别中极为常用。同时由于语音信号

具有类混沌的特性¨Ｊ，因而，部分学者利用随机共

振原理对语音信号进行处理旧Ｊ。本文尝试了一种

根据人耳听觉机理和随机共振理论ｂ＇４

Ｊ相结合的方

法，将随机共振理论运用到提取ＭＦＣＣ参数的过程

中。对标准ＭＦＣＣ参数提取过程和改进的ＭＦＣＣ参

数提取过程进行研究，并对其在说话人识别中的效

果做出了实验比较。

１标准的ＭＦＣＣ参数提取方法㈣６］

在语音识别和说话人识别中，ＭＦＣＣ（Ｍｅｌ频标

倒谱系数）参数是将人耳的听觉感知特性和语音的

２０１１年３月２４日收到

国家科技计划基金资助项目

（２００８ＲＲ０００３）、贵州省国际科技合作计划基金资助项目

（［２００９］７００１０９，［２００９］７００１２５）资助

第一作者简介：何朝霞（１９８４一），女，湖北人，硕士研究生，研究方

向：语音信号处理。

产生的机理相结合，是目前大多数语音识别中广泛

使用的特征参数。人耳具有一些特殊的功能，这些

功能使得人耳在嘈杂的环境中，以及各种变异情况

下仍能够正常地分辨出各种语音，其中耳蜗起了关

键的作用。耳蜗实质上相当于一个滤波器组，耳蜗

的滤波作用是在对数频率尺度上进行的，在

１

０００

Ｈｚ以下为线性尺度，而在１

ｏｏｏ

Ｈｚ以上为对

数尺度，这使得人耳对低频信号比对高频信号更加

敏感。根据这一原则，研究者根据心理实验得到了

类似于耳蜗作用的一组滤波器组，这就是Ｍｅｌ滤波

器组。

ＭＦＣＣ参数的提取流程框图如图ｌ所示，具体

计算步骤如下。

图１标准ＭＦＣＣ参数提取流程图

（１）语音信号经过预加重、加窗分帧处理后变

为短时信号，用ＦＦＴ将这些时域信号转化为频域

信号。

万方数据

下载后可阅读完整内容，剩余4页未读，立即下载

小崔个人精进录

粉丝: 39
资源: 316

基于随机共振的改进MFCC说话人识别方法

语音识别中的MFCC系数提取方法

MATLAB实现的MFCC参数提取方法详解

MFCC特征提取改进算法在说话人识别中的应用

论文研究-说话人识别中MFCC参数提取的改进.pdf

作为说话人识别特征参量的MFCC的提取过程

【说话人识别】基MFCC特征最近邻说话人识别系统含Matlab源码.zip

几种改进的MFCC特征提取方法

声纹识别特征MFCC的提取方法研究.pdf

深度学习说话人识别中语音特征参数提取研究.pdf

MFCC参数提取的matlab实现

最新资源