嵌入式系统实时语音识别:DTW在线并行算法

需积分: 5 1 下载量 99 浏览量 更新于2024-08-13 收藏 525KB PDF 举报
"这篇论文是2010年由姜干新和陈伟发表的,探讨了如何在嵌入式语音识别系统中应用一种DTW(动态时间规整)在线并行算法来提升系统的实时性能。该算法通过对标准DTW算法的数据结构进行优化,实现了内存的动态分配和释放,以及多关键词的并行处理,从而降低了内存使用和识别时间。实验证明,此算法的实时系数达到1.17,提高了系统的实时性。" 在语音识别领域,动态时间规整(Dynamic Time Warping, DTW)是一种广泛使用的算法,用于比较两个时序数据序列,即使它们的长度不一致。DTW的核心思想是找到两个序列间的最优匹配路径,使得它们的对应元素之间的距离总和最小。在经典的DTW算法中,整个计算过程需要一次性存储所有中间计算结果,这在内存有限的嵌入式系统中可能会成为瓶颈。 针对这一问题,该论文提出了一个适用于嵌入式系统的DTW在线并行算法。首先,对DTW的数据结构进行了改进,以满足在线算法的需求。这意味着在寻找最佳路径的过程中,内存可以动态地连续分配和释放,或者在开始时就预先分配固定大小的内存,从而减少内存占用。其次,通过并行计算的思想,将多个关键词的DTW计算任务分布到多个运算单元上,这可以显著减少单个计算任务所需的时间,提高识别速度。 实验结果显示,这种在线并行的DTW算法在保持识别准确性的同时,减少了内存使用量,并且识别时间也有所下降。实时系数是衡量语音识别系统实时性能的重要指标,1.17的实时系数意味着系统处理语音的速度略快于实际语音的输入速度,因此该算法能够提供良好的实时语音识别体验。 该研究对嵌入式系统中的语音识别有着重要的实践意义,尤其是在资源受限的环境下,如智能家居、自动驾驶汽车或移动设备等应用场景,其提出的在线并行DTW算法能够有效地提升用户体验,同时降低系统资源消耗。此外,该算法还可以作为其他实时语音处理任务的基础,为后续的研究提供了一种有效的解决方案。