语音信号处理：基于EMD和WMCEP的共振峰提取新方法

158 浏览量更新于2024-08-30 收藏 1.5MB PDF 举报

"这篇研究论文探讨了一种新的语音信号共振峰提取算法，该算法结合了经验模态分解(EMD)和加权Mel倒谱(WMCEP)。作者赵涛涛和杨鸿武来自西北师范大学物理与电子工程学院。论文发表在2015年的《计算机工程与应用》第51卷第9期，详细阐述了如何利用EMD对语音信号进行分解，并通过WMCEP计算出包含频谱主要成分的新语音信号，进而提取共振峰。这种方法针对浊音信号的前三个共振峰频率特别有效，对于说话人识别、语音合成和语音编码等应用具有重要意义。" 文章首先指出，共振峰是语音信号处理中的关键特征，它们是语音频谱中的峰值，对应声道振动产生的共振频率。这些峰值具有高能量，对塑造语音的时域波形起决定性作用。对于浊音信号，前三个共振峰尤为重要，因为它们在区分不同元音和反映说话人个性特征方面起到关键作用。传统的共振峰提取算法主要有三种：基于频谱峰值提取法、基于线性预测求根法和基于语音分析合成法。然而，基于频谱峰值提取的算法虽然计算量小，但在复杂或噪声环境下的表现可能不理想。因此，本文提出了一种创新方法，结合了EMD和WMCEP。经验模态分解(EMD)是一种自适应的数据分析方法，能将非线性和非平稳信号分解为一系列内在模态函数(IMF)。在本文中，EMD被用来分解语音信号，得到与共振峰相关的IMF分量。随后，这些IMF被重新组合成新的语音信号。接着，利用这个新信号，计算加权Mel倒谱(WMCEP)。Mel倒谱是一种在语音处理中广泛使用的特征表示，它能有效地捕捉频谱的关键信息。通过加权，WMCEP能够更好地突出共振峰，从而提高提取精度。通过这种方法，论文的作者们声称能够更准确地提取出语音信号的共振峰，尤其适用于浊音信号。这种方法的优势在于它能够适应各种复杂的语音环境，提高了在噪声背景下的识别率，对于语音识别和合成等实际应用有显著的提升。这篇研究论文提出了一种结合EMD和WMCEP的共振峰提取技术，它为语音信号处理提供了一个新的视角，有望在语音处理领域产生积极影响。

2015，51（9）

1 引言

共振峰是语音信号处理领域最重要的特征参数之

一

[1]

，是指人在发声时气流通过声道引起声道振动而产

生的一组共振频率。共振峰一般对应为语音信号的频

谱峰值，具有较大的能量，是频谱的主要成分，决定了信

号的时域波形。大量的语音合成实验表明，对浊音信号

而言最主要的是前三个共振峰的频率。共振峰不仅是

区分不同元音的重要参数而且反映了不同说话人的个

性特征

[2]

，广泛应用于说话人识别、语音合成、语音编码

等领域。目前用于共振峰提取的算法主要分为三类：基

于频谱峰值提取法，基于线性预测求根法和基于语音分

析合成法

[3-4]

。基于频谱峰值提取算法由于计算量小，被

结合 EMD和加权 Mel倒谱的语音共振峰提取算法

赵涛涛，杨鸿武

ZHAO Taotao, YAN G Hongwu

西北师范大学物理与电子工程学院，兰州 730070

College of Physics and Elect ronic Engineering, Northwest Normal University, Lanzhou 730070, China

ZHAO Taotao, YANG Hongwu. Formant extraction algorithm of speech signal by combining EMD and WMCE P.

Comput er Engineering and Applic ations, 2015, 51（9）：207-212.

Abstract：T his paper presents a method to realize formant s extraction from speech signal. The speech signal is decom-

posed with Empiric al Mode Decomposi tion（EMD）to obt ain a set of formant-specific Intrinsic Mode Functions（IMF）.

The new speech signal is then generated by add ing the IMFs. The Weighted Mel-Cepstrum Coeffi cients（WMCC）, which

contain main comp onents of spectrum, are calculated from the new sp eech si gnal by using weighted mel-c epstrum analysis.

The Discrete Cosine Transform（DCT）based smooth algorithm is then applied to the WM CCs to obtain the smooth con-

tou r of spectrum in which the peaks of contour are candidate formant s. The formant frequencies are selected from candi date

formants according to the continuity constrain and the frequency range of formants. Tests show that the errors of this method

outper form t he weighted mel-cepstrum based method. When signal-to-noise ratio is less than 20 dB, the p roposed method

st ill can accurat ely extract the formants.

Key word s：formant; Empirical Mode Decomposition（EMD）; Intrinsic Mode Fun ctions（IMF）; Weighted Mel-Cepstrum

coeff icient（WMCEP）; Discrete Cosine Transform（DCT）

摘要：提出了一种利用经验模态分解（Empirical Mode Decomposition，EMD）和加权 Mel倒谱（Weighted Mel-Cepst rum

coefficients，WMCEP）提取语音信号共振峰的算法。对语音信号进行 EMD 分解，找出含有共振峰的固有模态函数

（Intrinsic Mode Func tion，IMF），并将其重构得到一个新的重构语音信号。对重构语音信号进行加权 Mel 倒谱分

析，获得包含频谱主要成分的加权 Mel倒谱系数；利用离散余弦平滑算法，从加权 Mel 倒谱系数获得谱包络，并从谱

包络的峰值位置获得候选共振峰；根据共振峰的连续性约束条件和频率范围，从候选共振峰筛选得到共振峰的估计

值。实验结果表明，该算法比单独使用 WMCEP 提取的共振峰误差更小，而且在信噪比小于 20 dB 时仍然能够准确

提取出共振峰。

关键词：共振峰；经验模态分解；固有模态函数；加权 Mel倒谱；离散余弦变换

文献标志码：A 中图分类号：TP391 doi：10.3778/j.issn.1002-8331.1407-0308

基金项目：国家自然科学基金（No.61263036）；甘肃省杰出青年基金（No.1210RJDA007）；甘肃省自然科学基金（No .1107RJZA112，

No.1208RJYA078）。

作者简介：赵涛涛（1984—），男，硕士研究生，主要研究领域为语音信号处理；杨鸿武（1969—），通讯作者，男，博士，教授，主要研究

领域为语音信号处理。E-mai l：yanghw@nwnu.edu.cn

收稿日期：2014-07-23 修回日期：2014-09-12 文章编号：1002-8331（2015）09-0207-06

CNKI网络优先出版：2014-10-29，http://www.cnki.net/kcms/d oi/10.3778/j.issn.100 2-8331.1407-0308.html

C omputer Engineering a nd Applications 计算机工程与应用

207

下载后可阅读完整内容，剩余5页未读，立即下载

weixin_38693657

粉丝: 0
资源: 926

语音信号处理：基于EMD和WMCEP的共振峰提取新方法

EMD与WMCEP结合的语音共振峰提取算法优化

基于emd vmd的手势识别和特征提取算法 matlab

基于EMD分解的BPSK信号编码序列识别算法

emd.zip_EMD信号分解_EMD分解_EMD提取包络_EMD特征提取_信号分解

emd.rar_EMD 信号分解_EMD 特征提取_EMD信号分解_信号非线性

EMD.rar_EMD分解_emd算法_信号分解

emd.rar_EMD 特征提取_信号 提取特征_信号特征_特征提取

emd.rar_EMD matlab_EMD 语音_EMD的端点效应_emd 端点效应_信号端点效应

EMD/HS法结合信号瞬时特征提取与性能分析

EMD方法：信号分解与特征提取技巧

最新资源

emd.rar_EMD 特征提取_信号提取特征_信号特征_特征提取