基于MCE的CHMM语音识别有效学习方法研究
需积分: 9 64 浏览量
更新于2024-08-12
收藏 876KB PDF 举报
语音识别中基于MCE准则的CHMM学习方法,是一项针对连续高斯混合马尔可夫模型(Continuous Gaussian Mixture Hidden Markov Model,CHMM)的研究论文。该研究于2000年由赵力、邹采荣和吴镇扬三位作者在东南大学无线电工程系完成。他们探讨了如何运用Minimum Classification Error (MCE)原则来优化CHMM的学习过程。
MCE学习方法相较于传统的Maximum Likelihood (ML)方法,能够显著提升HMM(隐马尔可夫模型)的识别性能,因为它更侧重于找到最小分类错误的模型参数,而非单纯最大化似然性。然而,早期的研究在MCE学习的函数定义和最小化方法上仍有改进空间。本文的主要贡献在于提出了一种适合CHMM的简化形式的识别函数、误差函数和损失函数定义,以及一种有效的方法来最小化总损失函数,特别考虑到大词汇量汉语连续语音识别系统中计算量大的特性。
作者定义了总学习样本集合Y和各类样本集合,比如第k类有Nk个观察抽样样本,每个样本包含一系列观测值。在CHMM的MCE学习中,他们明确了识别函数的使用,这个函数旨在找到模型参数,使得模型对每个类别的预测最接近实际观察。误差函数则用来衡量模型预测与实际观察之间的差异,而损失函数则是根据这些误差综合评估模型性能。
为了减少总损失函数最小化过程中的计算负担,他们还设计了一种最小点搜索算法,这种算法能够在保证学习效果的同时,降低模型训练的复杂度。通过大规模的非特定话者汉语连续语音识别实验,作者验证了他们的函数形式和损失函数最小化方法对CHMM的MCE学习确实有效,显著提高了识别准确性和效率。
总结来说,这篇论文不仅提供了MCE学习方法在CHMM上的具体应用,还提出了优化策略,对于语音识别领域的模型训练和性能提升具有重要意义。其研究成果对于后续的研究者来说,是理解和改进CHMM学习技术的重要参考文献。
2021-10-13 上传
105 浏览量
2022-08-04 上传
2021-04-30 上传
2021-08-18 上传
2019-09-12 上传
2021-07-12 上传
weixin_38693720
- 粉丝: 10
- 资源: 900
最新资源
- c代码-条件练习集合
- matlab由频域变时域的代码-eureca_face:EuRECA2021短期项目
- rsm
- 大三上学期实训——学生成绩管理系统,java后台,SpringMVC框架,mysql数据库.zip
- 14Oct_BatchProject:14Oct_Python批处理带有完整代码的Django网站项目
- modelo-tcc-uefs-ieee:模版乳胶Para Tratraho deConclusãode Curso de Engenharia daComputaçãoUniversidade Estadual de Feira de Santana-UEFS
- TestAssignmentForAndroidInternship
- QQ空间导出助手插件QZoneExport.zip
- cpp代码-165.4.6.3
- kafka-logsize-exporter:Python prometheus client for kafka logsize(Prometheus基于kafka logsize监控)
- hq9plus-in-perl6:用Perl 6编写的hq9 +解释器
- 基于Java的学生成绩学分制管理系统.zip
- dom4j-1.6.1.zip
- Metals_Mapping_GAM:使用广义添加剂建模进行预测性金属映射
- cpp代码-161.4.3.2
- ema-john-simple