EMD与WMCEP结合的语音共振峰提取算法优化

需积分: 15 1 下载量 139 浏览量 更新于2024-09-07 收藏 719KB PDF 举报
本文研究论文"结合EMD和加权Mel倒谱的语音共振峰提取算法"发表于2015年的《计算机工程与应用》杂志第51卷第9期,由赵涛涛和杨鸿武两位作者共同完成。他们针对语音信号处理领域的关键特性——共振峰,提出了一种新颖的算法。共振峰是语音信号的重要特征,反映了说话人的个性特征和语音的音质,特别是在浊音信号中,前三个共振峰的频率尤为关键,被广泛应用在说话人识别、语音合成和编码等方面。 该算法的核心步骤包括以下几个部分: 1. 经验模态分解(EMD):首先,作者采用经验模态分解方法对原始语音信号进行分解,这是一种非线性时间序列分析技术,可以将复杂信号分解为一组具有内在周期性和相对平稳性的固有模态函数(IMF)。这些IMF反映了信号的不同频率成分,其中可能包含共振峰的信息。 2. 重构语音信号:从EMD得到的IMF中挑选与共振峰相关的成分,通过重构操作生成新的语音信号。这种方法保留了共振峰的频谱特征。 3. 加权Mel倒谱分析:接着,对重构后的语音信号进行加权Mel倒谱分析。加权Mel倒谱是一种常用的频谱分析技术,它将频谱信息转换到人耳感知更自然的方式,能突出语音中的关键频率成分,即共振峰。 4. 谱包络提取与共振峰候选筛选:通过对加权Mel倒谱系数进行离散余弦平滑处理,得到谱包络。谱包络的峰值通常对应共振峰。通过连续性约束和频率范围的考虑,从这些候选共振峰中筛选出最终的共振峰估计值。 5. 算法优势:实验结果显示,相比于单纯使用加权Mel倒谱提取,结合EMD的方法能够更准确地捕捉到共振峰,即使在信噪比较低(如20 dB以下)的情况下,仍能有效提取。这证明了新算法在噪声环境下具有更好的鲁棒性。 这项研究为语音共振峰的精确提取提供了一种创新且实用的方法,对于提高语音信号处理任务的性能,特别是那些依赖于共振峰特征的应用有着重要的意义。