基于FPGA的嵌入式非特定人语音识别系统LPc-LFCC系数计算

需积分: 34 16 下载量 26 浏览量 更新于2024-08-10 收藏 6.39MB PDF 举报
本篇文章主要探讨的是在嵌入式非特定人孤立词语音识别系统设计与实现中的关键技术,特别是在计算LPc(线性预测系数)和LFCC(线性预测 cepstral coefficients,线性预测梅尔频率倒谱系数)系数方面。作者赵淳,硕士研究生,专业为软件工程,研究方向聚焦于如何利用FPGA(现场可编程门阵列)作为平台,提高语音识别算法在低成本、嵌入式环境下的性能。 在特征提取算法实现部分,首先,计算自相关系数是关键步骤。作者提到,自相关系数通过整数乘法和累加计算得出,虽然原始输入是16位整数,但实际有效数据只有低12位。由于自相关系数理论上不会超过32位,因此使用一个长为P+1的一维long型数组存储结果,其中P为LPC阶数(在此处设定为10)。自相关系数的计算遵循公式(rn = (rm * r(n-m)),n=1,2,...,P,通过数组索引进行计算。 接下来,利用自相关系数的特性,即R(f)=R(-f),计算LPc系数,这些系数反映了语音信号的频率特性。LFCC系数则是对自相关系数进行离散余弦变换(Discrete Cosine Transform,DCT)后的结果,这一步有助于提取更高级别的特征,提高语音识别的准确性和鲁棒性。 文章强调了FPGA在语音识别系统中的优势,相比于传统的MCU(微控制器)和DSP(数字信号处理器),FPGA具有更高的性价比和实时处理能力。研究的重点在于设计FPGA上的语音识别系统架构,包括优化嵌入式语音算法的实现,划分软硬件模块,以及开发适用于非特定人的语音识别系统软件,使其能应用于玩具或学习类电子产品的语音控制。 此外,论文还提到了项目背景,来源于“十五”重点学科建设项目和北京市教委基金支持,旨在推动语言识别技术在环绕智能领域的发展,特别是低成本嵌入式语音识别技术的研究。研究的关键词包括语音识别、动态时间规整(DTW,用于声纹匹配)、嵌入式系统和非特定人,这些关键词展示了研究的学术价值和实际应用场景。整个研究为基于FPGA的低成本SoPC(可编程片上系统)语音控制系统提供了理论和实践基础,为语音识别技术在嵌入式设备中的广泛应用做出了贡献。