MMCC特征:融合Mellin变换与Mel频率分析的非特定人语音识别
3星 · 超过75%的资源 需积分: 10 81 浏览量
更新于2024-11-24
收藏 378KB PDF 举报
"本文主要探讨了一种新型的非特定人语音识别特征——MMCC特征,该特征结合了Mellin变换和Mel频率分析的优势。Mellin变换具有尺度不变性,能够有效地降低不同说话人间声道差异对特征参数的影响。同时,通过引入Mel频率,模拟人耳对声音频率的感知特性,提高了特征的鲁棒性,使其更适合于非特定人的语音识别系统。实验结果显示,使用MMCC特征的识别系统在性能上超越了采用LPCC(线性预测 cepstral系数)、MFCC(Mel频率倒谱系数)和MMTLS(基于Mellin变换的线性预测)特征的系统。这一研究成果发表在2005年的《模式识别与人工智能》杂志第18卷第3期上,对于非特定人语音识别技术的发展具有重要意义。"
在语音识别领域,特征提取是关键步骤,因为它决定了识别系统的性能。Mellin变换是一种特殊的积分变换,其尺度不变性使得它在处理尺度变化的问题时表现出色。在语音信号中,说话人的声道长度变化会导致频率成分的改变,而Mellin变换可以减小这种变化对特征提取的影响,从而提高识别的准确性。
Mel频率分析则是借鉴了人类听觉系统对不同频率敏感性的特点。在Mel尺度上,频率间隔更贴近人耳对高频和低频声音感知的差异。因此,Mel频率倒谱系数(MFCC)被广泛用于语音识别,因为它能有效地捕获语音信号中对人耳听觉重要的信息。然而,MMCC特征在MFCC的基础上结合了Mellin变换,进一步增强了特征的稳定性和识别效果。
实验比较显示,MMCC特征在非特定人语音识别任务上的表现优于传统的LPCC特征,后者依赖于线性预测来提取特征;也优于MFCC特征,尽管MFCC在很多情况下已经表现良好;甚至优于MMTLS特征,这表明Mellin变换的引入对于提升识别率有着显著作用。
总结来说,这篇研究通过结合Mellin变换和Mel频率分析,提出了一种新的语音识别特征,提高了非特定人语音识别系统的性能,对于实际应用中的语音识别技术有着积极的推动作用。这一创新方法有望在未来的语音识别系统设计中得到广泛应用,并可能启发更多关于特征提取和声学模型优化的研究。
1584 浏览量
413 浏览量
2020-04-03 上传
2021-04-08 上传
2021-07-26 上传
158 浏览量
107 浏览量
viviantena
- 粉丝: 1
- 资源: 20
最新资源
- 行业文档-设计装置-一种平板式太阳能导热接头.zip
- PullelaSneha_152634_PHASE3
- windows server 2012无法远程登录补丁.zip
- MapMatching-new2.zip
- 布达
- matlab确定眼睛的代码-MSc_Robotics_Project:MSc_Robotics_Project
- challenge05-ignite
- 行业文档-设计装置-一种具有储藏功能的漏斗.zip
- imobiliaria:网站desenvolvido para umaimobiliária
- KepServer可以将任何工业设备的通信协议转换为opc协议,然后用OPCAutomation进行上位机数据读写。
- RouteConverter-开源
- beginner_tutorials.tar.gz
- 非调试版本-C Runtime Library11.0.51106.1
- matlab确定眼睛的代码-PupilDetection_DLC:使用训练有素的DLC网络检测瞳Kong+确定直径,位置并从结果中闪烁
- gowork:golang中的任务分配管理系统
- 行业文档-设计装置-香蕉茎纤维复合牛皮纸的制备方法.zip