基于RNN与MLP的语音识别系统对比研究

需积分: 0 0 下载量 143 浏览量 更新于2024-08-05 收藏 409KB PDF 举报
本文主要探讨了基于神经网络的语音识别技术在提高语音识别系统准确率方面的应用。作者滕云、贺春林和岳淼针对一般语音识别系统存在的准确率较低问题,选择了循环神经网络(RNN)和多层感知器(MLP)这两种神经网络结构作为识别模块的核心技术进行研究。 首先,神经网络因其优秀的抽象分类能力,已经成为语音识别系统设计中的重要工具。循环神经网络(RNN)通过其特有的时间序列处理能力,能够捕捉到语音信号中的时序信息,适合处理连续的语音信号。而多层感知器(MLP),作为前馈神经网络的一种,虽然不直接处理时序数据,但其多层结构允许它学习复杂的非线性映射,对于特征的抽象表示非常有效。 作者构建了两种不同类型的语音识别系统,一种采用RNN作为识别模块,另一种则使用MLP。RNN通过内部状态的记忆机制,可以考虑之前的信息来预测当前的语音特征,从而提高识别性能。而MLP则通过多个隐藏层的学习,能够对输入特征进行多层次的处理,提高了识别精度。 特征提取模块是整个系统的关键部分,它运用线性预测编码(LPC)和倒谱编码器将原始语音信号转化为LPC倒谱空间中的曲线,这样既减小了模型的复杂度,又保留了语音的重要信息。通过这种方式,特征提取模块提供了识别模块所需的有效输入。 实验结果显示,尽管RNN在某些情况下可能展现出强大的记忆能力,但在这次研究中,多层感知器(MLP)的方法在识别准确率上超过了循环神经网络,达到了85%的较高水平。这表明MLP在处理语音识别任务时表现更为优越。 总结来说,本文深入研究了神经网络在语音识别中的应用,特别是在RNN和MLP的选择与对比分析上,强调了特征提取和识别模块在语音识别系统中的作用,并通过实验证明了MLP在提高识别准确率上的优势。这一研究成果对于改进语音识别系统的性能和实际应用具有重要意义。