EMD与WMCEP结合的语音共振峰提取算法优化
需积分: 15 139 浏览量
更新于2024-09-07
收藏 719KB PDF 举报
本文研究论文"结合EMD和加权Mel倒谱的语音共振峰提取算法"发表于2015年的《计算机工程与应用》杂志第51卷第9期,由赵涛涛和杨鸿武两位作者共同完成。他们针对语音信号处理领域的关键特性——共振峰,提出了一种新颖的算法。共振峰是语音信号的重要特征,反映了说话人的个性特征和语音的音质,特别是在浊音信号中,前三个共振峰的频率尤为关键,被广泛应用在说话人识别、语音合成和编码等方面。
该算法的核心步骤包括以下几个部分:
1. 经验模态分解(EMD):首先,作者采用经验模态分解方法对原始语音信号进行分解,这是一种非线性时间序列分析技术,可以将复杂信号分解为一组具有内在周期性和相对平稳性的固有模态函数(IMF)。这些IMF反映了信号的不同频率成分,其中可能包含共振峰的信息。
2. 重构语音信号:从EMD得到的IMF中挑选与共振峰相关的成分,通过重构操作生成新的语音信号。这种方法保留了共振峰的频谱特征。
3. 加权Mel倒谱分析:接着,对重构后的语音信号进行加权Mel倒谱分析。加权Mel倒谱是一种常用的频谱分析技术,它将频谱信息转换到人耳感知更自然的方式,能突出语音中的关键频率成分,即共振峰。
4. 谱包络提取与共振峰候选筛选:通过对加权Mel倒谱系数进行离散余弦平滑处理,得到谱包络。谱包络的峰值通常对应共振峰。通过连续性约束和频率范围的考虑,从这些候选共振峰中筛选出最终的共振峰估计值。
5. 算法优势:实验结果显示,相比于单纯使用加权Mel倒谱提取,结合EMD的方法能够更准确地捕捉到共振峰,即使在信噪比较低(如20 dB以下)的情况下,仍能有效提取。这证明了新算法在噪声环境下具有更好的鲁棒性。
这项研究为语音共振峰的精确提取提供了一种创新且实用的方法,对于提高语音信号处理任务的性能,特别是那些依赖于共振峰特征的应用有着重要的意义。
2019-09-20 上传
2021-03-03 上传
2019-09-07 上传
2019-07-23 上传
2019-08-16 上传
2019-08-15 上传
2019-09-19 上传
2019-09-20 上传
weixin_38743506
- 粉丝: 350
- 资源: 2万+
最新资源
- 探索数据转换实验平台在设备装置中的应用
- 使用git-log-to-tikz.py将Git日志转换为TIKZ图形
- 小栗子源码2.9.3版本发布
- 使用Tinder-Hack-Client实现Tinder API交互
- Android Studio新模板:个性化Material Design导航抽屉
- React API分页模块:数据获取与页面管理
- C语言实现顺序表的动态分配方法
- 光催化分解水产氢固溶体催化剂制备技术揭秘
- VS2013环境下tinyxml库的32位与64位编译指南
- 网易云歌词情感分析系统实现与架构
- React应用展示GitHub用户详细信息及项目分析
- LayUI2.1.6帮助文档API功能详解
- 全栈开发实现的chatgpt应用可打包小程序/H5/App
- C++实现顺序表的动态内存分配技术
- Java制作水果格斗游戏:策略与随机性的结合
- 基于若依框架的后台管理系统开发实例解析