嵌入式语音识别:多类分类SVM在OMAP5912上的实现

需积分: 5 1 下载量 111 浏览量 更新于2024-09-06 收藏 208KB PDF 举报
"这篇论文主要探讨了多类分类支持向量机在OMAP5912开发板上的移植,用于语音识别。作者通过提取MFCC参数作为语音特征,并使用支持向量机(SVM)作为识别网络,实现了非特定人孤立词的识别。文章对比了三种多类分类方法,包括‘一对余’、‘一对一’和‘决策有向无环图’,并对这些方法的优缺点进行了分析。实验结果显示,识别率达到了95%以上。同时,详细阐述了SVM在OMAP5912开发板上的移植过程,该开发板结合了低功耗的ARM926EJ-S微处理器和高性能的TMS320C55X DSP核心,适用于多媒体应用。" 在语音识别领域,支持向量机(SVM)作为一种统计概率模型,被证明在识别任务中表现优秀。OMAP5912开发板因其独特的双核架构,可以高效地处理语音识别这类多媒体应用。论文中,研究者首先利用梅尔频率倒谱系数(MFCC)提取语音特征,MFCC是语音处理中常用的一种特征提取技术,能有效地捕捉语音的频谱特性。接着,他们选用SVM作为分类器,构建识别网络,以处理非特定人的孤立词识别,这是一种常见的语音识别应用场景。 对于多类分类问题,论文提出了三种常见策略。第一种是“一对余”方法,它需要构建k个分类器,每个分类器将一类样本与其余类分开。在预测阶段,选取决策函数输出值最大的类别作为样本的归属。第二种是“一对一”方法,每两个类别的组合都会形成一个分类器,总共需要训练k*(k-1)/2个分类器。第三种是“决策有向无环图”(DAG),它通过构建有向无环图来减少分类器的数量。每种方法都有其优缺点,例如“一对余”方法简单但可能产生冗余分类器,“一对一”方法可能更准确但计算复杂度较高,而DAG则试图在效率和准确性之间找到平衡。 实验部分,研究者对算法的各个参数进行了细致的测试,以找到最佳参数组合,最终实现了超过95%的识别率。此外,论文详细描述了将SVM算法移植到OMAP5912开发板的具体步骤,包括硬件适配、软件优化以及实际运行环境的设置,这对于在嵌入式系统中应用SVM有着重要的参考价值。 这篇论文深入探讨了SVM在嵌入式语音识别系统中的应用,特别是在OMAP5912开发板上的实现,为后续的语音识别研究和实践提供了有价值的参考。