基于MCE的CHMM语音识别有效学习方法研究

需积分: 9 56 浏览量更新于2024-08-12 收藏 876KB PDF 举报

语音识别中基于MCE准则的CHMM学习方法，是一项针对连续高斯混合马尔可夫模型（Continuous Gaussian Mixture Hidden Markov Model，CHMM）的研究论文。该研究于2000年由赵力、邹采荣和吴镇扬三位作者在东南大学无线电工程系完成。他们探讨了如何运用Minimum Classification Error (MCE)原则来优化CHMM的学习过程。 MCE学习方法相较于传统的Maximum Likelihood (ML)方法，能够显著提升HMM（隐马尔可夫模型）的识别性能，因为它更侧重于找到最小分类错误的模型参数，而非单纯最大化似然性。然而，早期的研究在MCE学习的函数定义和最小化方法上仍有改进空间。本文的主要贡献在于提出了一种适合CHMM的简化形式的识别函数、误差函数和损失函数定义，以及一种有效的方法来最小化总损失函数，特别考虑到大词汇量汉语连续语音识别系统中计算量大的特性。作者定义了总学习样本集合Y和各类样本集合，比如第k类有Nk个观察抽样样本，每个样本包含一系列观测值。在CHMM的MCE学习中，他们明确了识别函数的使用，这个函数旨在找到模型参数，使得模型对每个类别的预测最接近实际观察。误差函数则用来衡量模型预测与实际观察之间的差异，而损失函数则是根据这些误差综合评估模型性能。为了减少总损失函数最小化过程中的计算负担，他们还设计了一种最小点搜索算法，这种算法能够在保证学习效果的同时，降低模型训练的复杂度。通过大规模的非特定话者汉语连续语音识别实验，作者验证了他们的函数形式和损失函数最小化方法对CHMM的MCE学习确实有效，显著提高了识别准确性和效率。总结来说，这篇论文不仅提供了MCE学习方法在CHMM上的具体应用，还提出了优化策略，对于语音识别领域的模型训练和性能提升具有重要意义。其研究成果对于后续的研究者来说，是理解和改进CHMM学习技术的重要参考文献。

第３０卷第３期

２０００年５月

东南大学学报

（自然科学版）

ＪＯＵＲＮＡＬＯＦＳＯＵＴＨＥＡＳＴＵＮＩＶＥＲＳＩＴＹ（ＮａｔｕｒａｌＳｃｉｅｎｃｅＥｄｉｔｉｏｎ）

Ｖｏｌ３０Ｎｏ３

Ｍａｙ２０００

语音识别中基于ＭＣＥ准则的ＣＨＭＭ学习方法



赵　力　邹采荣　吴镇扬

（东南大学无线电工程系，南京２１００９６）

摘　要　研究了用于ＣＨＭＭ的ＭＣＥ学习方法．提出了简单形式的识别函数、误差函

数、损失函数等的定义方法以及总损失函数的最小化方法．通过对非特定人汉语连续

语音识别实验，证明了提出的函数形式和损失函数最小化方法对ＣＨＭＭ的ＭＣＥ学

习的有效性．

关键词　ＭＣＥ；ＣＨＭＭ；语音识别

分类号　ＴＰ３９１４２；ＴＮ９１２３



国家自然科学资金资助项目（６９８７１００９）．

收稿日期：１９９９－１２－０９．　第一作者：男，１９５８年生，博士后．

对于基于ＭＣＥ（ＭｉｎｉｍｕｍＣｌａｓｓｉｆｉｃａｔｉｏｎＥｒｒｏｒ）的隐马尔可夫模型（ＨＭＭ）学习方法已经有

了很多研究

［１～３］

，证明了这种学习方法和传统的ＭＬ法（ＭａｘｉｍｕｍＬｉｋｅｌｉｈｏｏｄｍｅｔｈｏｄ）相比能够

较好地改善ＨＭＭ的识别性能，是一种有效的ＨＭＭ模型学习方法．然而，在已发表的研究成果

中，对于在

ＨＭＭ的ＭＣＥ学习中的各函数定义方法以及最小化迭代方法等方面，仍需要进一

步的改进

．

本文研究了把ＭＣＥ法用于ＣＨＭＭ（ＣｏｎｔｉｎｕｏｕｓＧａｕｓｓｉａｎｄｅｎｓｉｔｙＨＭＭ）学习的方法，提出了

适合于ＣＨＭＭ的简单形式识别函数、误差函数、损失函数等的定义方法和使总损失函数最小

化的推定方法，并结合大词汇量汉语连续语音识别系统计算量大的特点，提出了一种减少总损

失函数最小化推定计算量的最小点搜索算法

．通过对不特定话者汉语大词汇量连续语音识别

实验，证明了提出的函数形式和损失函数最小化方法对ＣＨＭＭ的ＭＣＥ学习的有效性．

１　基于ＭＣＥ法的ＣＨＭＭ学习

１１　ＭＣＥ学习的函数定义

　　为了说明在ＣＨＭＭ的ＭＣＥ学习法中定义的各函数，假定Ｙ＝｛Ｙ

１

，…，Ｙ

ｋ

，…，Ｙ

Ｋ

｝是总的

学习样本的集合，共有Ｋ类．Ｙ

ｋ

＝｛Ｙ

ｋ，１

，…，Ｙ

ｋ，ｎ

，…，Ｙ

ｋ，Ｎ

ｋ

｝是第ｋ类学习样本的集合，共有Ｎ

ｋ

个观察抽样样本．Ｙ

ｋ，ｎ

＝ｙ

ｋ，ｎ，１

，…，ｙ

ｋ，ｎ，ｔ

，…，ｙ

ｋ，ｎ，Ｔ

ｋ，

{ }

ｎ

是第ｋ类第ｎ个学习样本，Ｔ

ｋ，ｎ

是第ｋ类第

ｎ个学习样本的长度，ｙ

ｋ，ｎ，ｔ

是第ｋ类第ｎ个学习样本在ｔ时刻的Ｄ维向量．

＝｛

１

，…，

ｉ

，…，

Ｉ

｝是ＣＨＭＭ模型参数的集合，Ｉ是ＣＨＭＭ模型的个数．

ｉ

是第ｉ个ＣＨＭＭ的模型参数向量，

ｉ，ｓ，ｄ

是第ｉ个ＣＨＭＭ的第ｓ状态均值向量的第ｄ维元素，

ｉ，ｓ

是第ｉ个ＣＨＭＭ的第ｓ状态的协

方差矩阵．

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38693720

粉丝: 10

基于MCE的CHMM语音识别有效学习方法研究

提高鲁棒性和识别率：基于二次残差与改进MCE的说话人识别研究

利用最小错误率准则优化神经网络分类器组合

改进的最小分类误差算法：深度学习在台风云图识别中的优势

基于非均匀MCE准则的DNN关键词检测系统中声学模型的训练.docx

基于DNN技术的大规模连续语音识别

MCE现代综合评价方法软件

基于最大相关熵准则的鲁棒度量学习算法_谢林江1

作业.MCE.mce

基于改进最小分类误差准则算法的深度学习研究——以台风卫星云图为例

基于改进最小分类误差准则算法的深度学习研究——以台风卫星云图为例.pdf

最新资源