基于DSP的非特定人汉语孤立数字语音识别系统设计

需积分: 50 23 下载量 55 浏览量 更新于2024-08-10 收藏 3.96MB PDF 举报
该资源主要涉及的是一个基于DSP和HMM的语音识别系统的设计与实现,使用了SST39VF160芯片作为存储器,并详细介绍了该系统的硬件电路和软件设计。 在集成电路领域,SST39VF160是一款由SST公司生产的CMOS芯片,具有1M*16bit的存储容量。它具备优越的可靠性和低功耗特性,能够承受100,000次的擦写操作,数据保存时间长达100年。工作电压为3.3V,输出电压范围为0.4V至2.4V,输入电压范围为0.8V至2V。在工作状态下,电流消耗15mA,闲置时电流仅为4μA。此外,该芯片支持分扇区和分块擦除,以及整片擦除,提供了快速的读写周期。 在电路设计中,由于只需要64K的空间,SST39VF160的地址线的高4位被接地。这样的设计可以有效地利用芯片的存储空间,满足系统的需求。 进入语音识别领域,这个硕士学位论文是关于非特定人汉语孤立数字语音识别系统的,使用了DSP(Digital Signal Processor)TM320VC5402为核心处理器,结合AD50芯片进行模拟语音信号的采集。系统通过预处理、特征提取、模型训练和解码等步骤来实现语音识别。在预处理阶段,采用了VUS算法进行端点检测,以准确地找出语音片段。特征向量选取了12阶LPCC(Linear Predictive Cepstral Coefficients)系数、12点一阶差分倒谱系数和12点一阶差分能量系数,这些参数有助于捕获语音的特征。识别过程中,运用了HMM(Hidden Markov Model)模型,这是一种在语音识别中广泛应用的统计建模方法,用于建立语音模型并进行识别。 硬件设计部分,系统构建在TM320VC5402 DSP芯片上,包括了存储器扩展模块、LED显示、JTAG电路以及电源电路。存储器扩展模块可能使用了SST39VF160芯片来存储语音数据和识别模型。而LED显示则用于输出识别结果,JTAG电路则为调试和编程提供便利。 关键词包括语音识别、LPCC(线性预测 cepstral 系数)、隐马尔可夫模型和TM320VC5402 DSP芯片,这些是本文研究的核心技术点。 这个项目综合应用了集成电路、数字信号处理和机器学习技术,构建了一个实用的语音识别系统,具有广泛的应用前景,特别是在电话服务、数据输入和安全验证等领域。