嵌入式非特定人语音识别优化与拒识算法研究

需积分: 11 3 下载量 52 浏览量 更新于2024-07-16 收藏 3.98MB PDF 举报
本篇硕士学位论文主要探讨了在嵌入式环境下非特定人语音识别系统的研究,特别是在语音识别机理和拒识算法方面。作者李亦佳针对信息技术发展背景下对低成本、低功耗嵌入式语音产品的需求,提出了对识别率和拒识率的高要求。 论文首先介绍了嵌入式语音识别系统的特点,如处理速度较慢、软件代码精简和系统成本较低,这要求语音识别算法需在保证识别准确性的前提下,优化算法以减小计算负担。针对这一挑战,研究了小词汇量孤立词的语音识别技术,并对现有的嵌入式语音识别算法进行了改进。 接着,论文深入研究了现场可编程门阵列(FPGA)的基本原理及其在语音识别系统中的应用,构建了一个基于FPGA的嵌入式语音识别系统,实现了改进的前端处理算法和识别算法。这一步旨在提升系统的实时性和效率。 在语音拒识算法部分,作者探讨了贝叶斯网络的原理,并据此设计了一种基于贝叶斯网络结构的语音拒识算法。该算法旨在增强系统的抗干扰能力,避免误将非词表输入识别为正确的词,从而降低潜在的风险。 论文的核心部分是搭建了一个基于FPGA的语音识别仿真平台,将改进的识别算法和拒识算法整合起来,实现了面向非特定人群、孤立词和小词汇量的嵌入式语音识别系统。通过仿真测试,验证了算法的改进效果,并对测试结果进行了详细的性能分析。 最后,论文的结论指出,经过前端处理算法优化、语音识别算法的改进以及贝叶斯网络拒识算法的集成,所设计的嵌入式语音识别系统满足了实际应用中的性能需求,证明了其在低成本、低功耗嵌入式设备上的可行性和有效性。研究背景源于北京市教委基金项目和“211工程”重点学科建设项目,显示了研究的实用价值和学术意义。 本文不仅提供了对嵌入式语音识别技术的深入理解,还展示了如何通过技术创新来提升系统的性能和可靠性,对于嵌入式语音识别领域的实际应用具有重要的参考价值。