基于ZCPA特征的多种前端滤波器语音识别鲁棒性研究
3 浏览量
更新于2024-09-07
1
收藏 517KB PDF 举报
多种前端滤波器的ZCPA对语音多变性的鲁棒性研究
在语音识别领域中,鲁棒性研究是一个非常重要的课题。语音识别系统的鲁棒性不仅仅受到噪音的影响,还受到语音多变性的影响。为了提高语音识别系统的鲁棒性,需要研究不同前端滤波器对语音多变性的鲁棒性影响。本文研究了FIR滤波器、Gammatone(GT)滤波器、Laguerre滤波器和弯折滤波器(WFBs)对语音多变性的鲁棒性影响,使用支持向量机(SVM)作为后端识别系统。
首先,我们需要了解什么是语音多变性。语音多变性是指同一个speaker在不同的说话方式下语音的变化,例如快语音、慢语音、大声语音、温柔语音等。这些变化会对语音识别系统的鲁棒性产生影响。为了研究语音多变性的鲁棒性,我们需要选择合适的前端滤波器和后端识别系统。
在本文中,我们选择了FIR滤波器、Gammatone(GT)滤波器、Laguerre滤波器和弯折滤波器(WFBs)作为前端滤波器,使用支持向量机(SVM)作为后端识别系统。实验结果表明,在语音多变性的识别中,SVM系统较常用的HMM系统更适于ZCPA特征;并且在SVM系统下,ERB尺度的弯折滤波器较其他前端滤波器识别效果更好,明显优于常用的MFCC特征。
在语音识别领域中,前端滤波器的选择是非常重要的。不同的前端滤波器对语音信号的处理方式不同,对语音识别系统的鲁棒性也不同。FIR滤波器是一种常用的前端滤波器, Gammatone(GT)滤波器是一种生物启发式滤波器, Laguerre滤波器是一种基于数学模型的滤波器,弯折滤波器(WFBs)是一种基于耳蜗模型的滤波器。每种前端滤波器都有其优缺,选择合适的前端滤波器对于语音识别系统的鲁棒性非常重要。
在本文中,我们还讨论了支持向量机(SVM)作为后端识别系统的优点。SVM是一种基于统计机器学习的识别系统,对语音识别任务有着很高的鲁棒性。SVM系统可以很好地处理语音信号中的噪音和变异,从而提高语音识别系统的鲁棒性。
本文研究了多种前端滤波器对语音多变性的鲁棒性影响,结果表明在语音多变性的识别中,SVM系统较常用的HMM系统更适于ZCPA特征;并且在SVM系统下,ERB尺度的弯折滤波器较其他前端滤波器识别效果更好,明显优于常用的MFCC特征。这项研究结果对于语音识别系统的鲁棒性研究有着重要的意义。
2021-02-24 上传
点击了解资源详情
点击了解资源详情
2021-09-21 上传
2022-06-28 上传
2021-09-07 上传
点击了解资源详情
点击了解资源详情
点击了解资源详情
weixin_38712874
- 粉丝: 10
- 资源: 947
最新资源
- 前端协作项目:发布猜图游戏功能与待修复事项
- Spring框架REST服务开发实践指南
- ALU课设实现基础与高级运算功能
- 深入了解STK:C++音频信号处理综合工具套件
- 华中科技大学电信学院软件无线电实验资料汇总
- CGSN数据解析与集成验证工具集:Python和Shell脚本
- Java实现的远程视频会议系统开发教程
- Change-OEM: 用Java修改Windows OEM信息与Logo
- cmnd:文本到远程API的桥接平台开发
- 解决BIOS刷写错误28:PRR.exe的应用与效果
- 深度学习对抗攻击库:adversarial_robustness_toolbox 1.10.0
- Win7系统CP2102驱动下载与安装指南
- 深入理解Java中的函数式编程技巧
- GY-906 MLX90614ESF传感器模块温度采集应用资料
- Adversarial Robustness Toolbox 1.15.1 工具包安装教程
- GNU Radio的供应商中立SDR开发包:gr-sdr介绍