EMD与WMCEP结合的语音共振峰提取算法优化
下载需积分: 15 | PDF格式 | 719KB |
更新于2024-09-07
| 65 浏览量 | 举报
本文研究论文"结合EMD和加权Mel倒谱的语音共振峰提取算法"发表于2015年的《计算机工程与应用》杂志第51卷第9期,由赵涛涛和杨鸿武两位作者共同完成。他们针对语音信号处理领域的关键特性——共振峰,提出了一种新颖的算法。共振峰是语音信号的重要特征,反映了说话人的个性特征和语音的音质,特别是在浊音信号中,前三个共振峰的频率尤为关键,被广泛应用在说话人识别、语音合成和编码等方面。
该算法的核心步骤包括以下几个部分:
1. 经验模态分解(EMD):首先,作者采用经验模态分解方法对原始语音信号进行分解,这是一种非线性时间序列分析技术,可以将复杂信号分解为一组具有内在周期性和相对平稳性的固有模态函数(IMF)。这些IMF反映了信号的不同频率成分,其中可能包含共振峰的信息。
2. 重构语音信号:从EMD得到的IMF中挑选与共振峰相关的成分,通过重构操作生成新的语音信号。这种方法保留了共振峰的频谱特征。
3. 加权Mel倒谱分析:接着,对重构后的语音信号进行加权Mel倒谱分析。加权Mel倒谱是一种常用的频谱分析技术,它将频谱信息转换到人耳感知更自然的方式,能突出语音中的关键频率成分,即共振峰。
4. 谱包络提取与共振峰候选筛选:通过对加权Mel倒谱系数进行离散余弦平滑处理,得到谱包络。谱包络的峰值通常对应共振峰。通过连续性约束和频率范围的考虑,从这些候选共振峰中筛选出最终的共振峰估计值。
5. 算法优势:实验结果显示,相比于单纯使用加权Mel倒谱提取,结合EMD的方法能够更准确地捕捉到共振峰,即使在信噪比较低(如20 dB以下)的情况下,仍能有效提取。这证明了新算法在噪声环境下具有更好的鲁棒性。
这项研究为语音共振峰的精确提取提供了一种创新且实用的方法,对于提高语音信号处理任务的性能,特别是那些依赖于共振峰特征的应用有着重要的意义。
相关推荐











weixin_38743506
- 粉丝: 352
最新资源
- 初学者入门必备!Visual C++开发的连连看小程序
- C#实现SqlServer分页存储过程示例分析
- 西门子工业网络通信例程解读与实践
- JavaScript实现表格变色与选中效果指南
- MVP与Retrofit2.0相结合的登录示例教程
- MFC实现透明泡泡效果与文件操作教程
- 探索Delphi ERP框架的核心功能与应用案例
- 爱尔兰COVID-19案例数据分析与可视化
- 提升效率的三维石头制作插件
- 人脸C++识别系统实现:源码与测试包
- MishMash Hackathon:Python编程马拉松盛事
- JavaScript Switch语句练习指南:简洁注释详解
- C语言实现的通讯录管理系统设计教程
- ASP.net实现用户登录注册功能模块详解
- 吉时利2000数据读取与分析教程
- 钻石画软件:从设计到生产的高效解决方案