提高鲁棒性和识别率:基于二次残差与改进MCE的说话人识别研究
需积分: 10 93 浏览量
更新于2024-09-05
收藏 265KB PDF 举报
该篇论文主要探讨了在说话人识别领域中,通过结合二次残差和改进的MCE模型来提高系统性能。作者严钦云、邱政权和尹俊勋针对特征提取阶段的鲁棒性问题,提出了一种新颖的方法,即从二次残差信号中提取决策特征。传统的特征可能在噪声环境中易受干扰,二次残差技术通过仅在预测残差内操作,减少了对语音共振峰的影响,有助于保持语音信号的频谱结构,从而增强系统在噪声环境下的鲁棒性。
在识别阶段,作者改进了MCE(混合高斯模型)模型,以减少计算量和提升运算速度。MCE模型原本在说话人识别中表现出色,但其训练时间较长的问题尤为显著,尤其是当系统包含更多说话人时,计算复杂度会急剧增加。为了解决这个问题,论文提出了一种创新策略,通过优化算法,仅计算部分类别间的判别函数,从而有效降低了计算负担。
论文的研究目标是提高说话人在噪声环境下的识别率和系统整体的鲁棒性,同时兼顾计算效率。结果表明,作者的新方法在保持语音质量的同时,显著提升了说话人识别的准确性和稳定性。因此,这项工作对于解决实际应用中的噪声抑制和高效识别问题具有重要的理论价值和实践意义,特别是在文本无关或文本相关的说话人识别任务中。
318 浏览量
384 浏览量
点击了解资源详情
2021-09-23 上传
257 浏览量
2021-09-25 上传
213 浏览量
132 浏览量

weixin_39840515
- 粉丝: 449

最新资源
- VB+SQL Server教师工资管理系统的源代码与部署指南
- 美女桌面图标集锦,性感风格一键下载
- 剑子店开源中文词典项目介绍
- AngularJS CRUD示例: 前端框架的应用演示
- 初学者入门:构建简单选课系统
- 简易物体检测识别python源代码实现
- Windows Server 2008 AD回收站工具:快速恢复被删除对象
- 电脑桌面素描图标素材下载推荐
- ComponentArt WebChart 2007.1.1171 ASP.NET控件发布与授权
- 《易学C++》电子教案全解析:教你轻松掌握C++
- BoilsoftVideoSplitterPortable:无需安装的视频剪切利器
- Java到C#代码转换详解
- MTK6235多号码电话本备份工具下载与使用体验
- 卡通头像桌面图标精选集下载
- 汇编程序设计:实现学生成绩与名次显示系统
- tiny4412板Android LED HAL示例教程与源码