支持向量机在非特定人孤立数字语音识别中的应用
需积分: 13 36 浏览量
更新于2024-08-08
收藏 451KB PDF 举报
"基于支持向量机的非特定人孤立数字语音识别 (2009年)",这篇论文探讨了一种利用支持向量机(SVM)进行非特定人、不连续数字语音信号识别的方法,旨在提高识别速度和准确性,并与传统的隐马尔可夫模型(HMM)进行了对比。
支持向量机(Support Vector Machines)是一种监督学习模型,常用于分类和回归分析。在语音识别中,SVM通过构建一个能够区分不同语音类别的决策边界来工作。在训练阶段,SVM利用已知的语音样本(来自预建立的语音库)找到一个最优超平面,这个超平面能够最大程度地将不同数字的语音样本分开,形成支持向量。支持向量是距离超平面最近的样本点,它们对于确定决策边界至关重要。
论文中提到的特征提取方法是梅尔频率倒谱系数(Mel Frequency Cepstral Coefficients, MFFC)。MFFC是语音处理中常用的特征提取技术,它能够捕捉到人类听觉系统对声音频率感知的关键特性。在识别过程中,首先对被测语音信号应用MFFC算法,将其转换成一组代表语音特征的向量,然后使用经过训练的支持向量机进行分类识别。
端点检测是语音处理中的一个重要环节,用于确定语音信号的起始和结束点。论文提出了使用短时区域能量谱来实现这一功能。短时分析通过对语音信号进行小窗口滑动,计算每个窗口内的能量谱,通过分析能量谱的变化来判断语音段的边界。
论文对比了支持向量机算法与隐马尔可夫模型(Hidden Markov Models, HMM)。HMM在语音识别领域广泛应用,但其计算复杂度较高,尤其是在非特定人和孤立词识别场景下。相比之下,SVM在识别速度和准确性上有优势,因为它不需要建模语音的动态变化,而是依赖于静态特征和优化的决策边界。
这篇论文贡献了一种基于SVM的非特定人孤立数字语音识别方法,该方法在训练和识别流程上进行了优化,特别是在特征提取和端点检测方面,从而提高了识别效率和精确度。通过实验证明,与HMM相比,SVM算法在处理非特定人的孤立数字语音时表现更优。
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
250 浏览量
275 浏览量
160 浏览量
570 浏览量
2021-04-16 上传
weixin_38710198
- 粉丝: 6
- 资源: 912
最新资源
- bash脚本编写教程
- WSC/ADL:Web Services组合系统体系结构描述语言
- 常用开源软件说明手册
- 高质量c++编程指南
- map reduce by google inc
- bigtable by google inc
- U-BOOT 在S3C2410的移植
- 《计算机组成原理》第一章课件
- Practical Apache Struts 2 Web 2.0 Projects.pdf
- ACM+算法集--常用ACM算法
- 华为电路设计规范,得到很多人的认可
- sq安装步骤,安装问题
- linux下建立DNS
- Arcgis开发宝典
- 是个IC资料 PDF型的
- 办公自动化EXECL(提高操作EXECL的能力)