流形正则化极限学习机在语种识别中的应用

0 下载量 112 浏览量 更新于2024-08-29 收藏 482KB PDF 举报
"这篇研究论文探讨了基于流形正则化的极限学习机(Manifold Regularized Extreme Learning Machine, MRELM)在语种识别系统中的应用。相较于支持向量机(Support Vector Machine, SVM),极限学习机(Extreme Learning Machine, ELM)具有易于实现和快速训练的优势,并且在许多领域的识别性能上可以与SVM相媲美或更优。文中提出了一种新的MRELM算法,旨在解决ELM因随机初始化模型参数可能导致的问题。实验结果显示,该算法在高斯超矢量(Gaussian Supervector, GSV)特征空间上对于30秒语音的识别性能显著提高,并且在i-vector特征空间中也能达到接近当前主流打分算法的识别效果。" 本文的核心内容围绕着语种识别技术展开,特别关注了两种机器学习方法——SVM和ELM。SVM作为传统的分类器,在语种识别中已有广泛应用,但其训练过程可能相对复杂。而ELM则以其简单的实现方式和快速的训练速度受到关注。然而,ELM的随机初始化参数可能会导致模型的不稳定性。 为了解决这个问题,研究人员提出了MRELM,这是一种结合了流形学习的ELM变体。流形学习是一种无监督学习方法,用于发现数据的内在结构,以减少数据维度并保持其重要特性。MRELM通过在ELM训练过程中引入流形正则化,能够更好地捕捉数据的非线性特征,从而提高识别准确性和稳定性。 实验部分对比了MRELM在GSV特征空间上的表现与SVM基线系统的性能,结果显示MRELM在识别30秒语音片段时表现出优越性。此外,MRELM也应用于i-vector特征空间,其识别性能接近当前主流的打分算法,显示出在不同特征表示下的适应性。 关键词包括语种识别、极限学习机、流形学习和支持向量机,反映了论文的主要研究领域和技术手段。这篇论文为语种识别提供了新的视角和方法,特别是在利用MRELM优化ELM性能方面,对语音处理和机器学习领域的研究具有重要意义。