语音信号处理:基于EMD和WMCEP的共振峰提取新方法

0 下载量 158 浏览量 更新于2024-08-30 收藏 1.5MB PDF 举报
"这篇研究论文探讨了一种新的语音信号共振峰提取算法,该算法结合了经验模态分解(EMD)和加权Mel倒谱(WMCEP)。作者赵涛涛和杨鸿武来自西北师范大学物理与电子工程学院。论文发表在2015年的《计算机工程与应用》第51卷第9期,详细阐述了如何利用EMD对语音信号进行分解,并通过WMCEP计算出包含频谱主要成分的新语音信号,进而提取共振峰。这种方法针对浊音信号的前三个共振峰频率特别有效,对于说话人识别、语音合成和语音编码等应用具有重要意义。" 文章首先指出,共振峰是语音信号处理中的关键特征,它们是语音频谱中的峰值,对应声道振动产生的共振频率。这些峰值具有高能量,对塑造语音的时域波形起决定性作用。对于浊音信号,前三个共振峰尤为重要,因为它们在区分不同元音和反映说话人个性特征方面起到关键作用。 传统的共振峰提取算法主要有三种:基于频谱峰值提取法、基于线性预测求根法和基于语音分析合成法。然而,基于频谱峰值提取的算法虽然计算量小,但在复杂或噪声环境下的表现可能不理想。因此,本文提出了一种创新方法,结合了EMD和WMCEP。 经验模态分解(EMD)是一种自适应的数据分析方法,能将非线性和非平稳信号分解为一系列内在模态函数(IMF)。在本文中,EMD被用来分解语音信号,得到与共振峰相关的IMF分量。随后,这些IMF被重新组合成新的语音信号。 接着,利用这个新信号,计算加权Mel倒谱(WMCEP)。Mel倒谱是一种在语音处理中广泛使用的特征表示,它能有效地捕捉频谱的关键信息。通过加权,WMCEP能够更好地突出共振峰,从而提高提取精度。 通过这种方法,论文的作者们声称能够更准确地提取出语音信号的共振峰,尤其适用于浊音信号。这种方法的优势在于它能够适应各种复杂的语音环境,提高了在噪声背景下的识别率,对于语音识别和合成等实际应用有显著的提升。 这篇研究论文提出了一种结合EMD和WMCEP的共振峰提取技术,它为语音信号处理提供了一个新的视角,有望在语音处理领域产生积极影响。