没有合适的资源?快使用搜索试试~ 我知道了~
首页语音信号处理-DTW语音识别
语音信号处理-DTW语音识别
需积分: 15 261 浏览量
更新于2023-05-27
评论 1
收藏 168KB DOC 举报
(1) 掌握DTW(动态时间规划)算法; (2) 使用MATLAB编程利用DTW算法进行说话者的语音识别;
资源详情
资源评论
资源推荐

华南理工大学
《语音信号处理》实验报告
实验名称: DTW 语音识别
姓 名:
学 号:
班 级:
日 期:

1. 实验目的
掌握 动态时间规划算法;
使用 编程利用 算法进行说话者的语音识别;
2. 实验原理
(1) 语音识别系统简述
语音识别系统的原理框图如图 所示。从图中可以看出语音识别系统的本
质就是一种模式识别系统,它包括特征提取、模式匹配、参考模式库等基本单
元。语音信号需要进行前期的预处理,预处理过程包括预滤波、采样和量化、
分帧、加窗、预加重、端点检测等。经过预处理的语音数据就可以进行特征参
数提取。在训练阶段,将特征参数进行一定的处理之后,为每个词条得到一个
模型,保存为模板库。在识别阶段,语音信号经过相同的通道得到语音参数,
生成测试模板,与参考模板进行匹配,将匹配分数最高的参考模板作为识别结
果。
图 2-1 语音识别系统框图

(2) 语音信号预处理
语音信号采集
本实验采用了 下的录音机程序录制 文件,然后使用
函数读入。为了进行批量的训练和识别处理,本系统采集了 到 共
个训练语音和 到 共 个识别语音。
分帧
语音信号具有短时平稳特性。在实际处理时可以将语音信号分成很小的时
间段约 ,称之为“帧”,作为语音信号处理的最小单位,帧与帧的非重
叠部分称为帧移。
本实验使用函数 !"!#进行分帧,其中 为语音信号," 为帧
长,# 为帧移。帧长取 $,帧移取 %。
预加重
必须对语音信号的高频进行加重处理,一般是将语音信号通过一个一阶高
通滤波器 &'(
,称为预加重滤波器。其目的是滤除低频干扰,将对语音
识别更为有用的高频部分进行频谱提升。在计算短时能量之前将语音信号通过
预加重滤波器还可起到消除直流漂移、抑制随机噪声和提升清音部分能量的效
果。在 中预加重滤波器可由语句 )*"+&',!! 实现。
$加窗
利用窗函数来减少由截断处理导致的吉布斯效应。本实验采用矩形窗和汉
明窗。在语音的时域处理方法中,一般选择矩形窗,而在语音的频域处理方法
中,一般选择汉明窗。在 "- 中要实现加窗即将分帧后的语音信号乘上窗函
数,如加汉明窗即为 ) ./01。本系统中的端点检测采用时域方法故加
矩形窗,计算 233 系数时加汉明窗。
'端点检测
在基于 算法的语音识别系统中,无论是训练建立模板阶段还是在识别
阶段,都要先采用端点检测算法确定语音的起点和终点。端点检测最常见的方
法是短时能量短时过零率双门限端点检测。
双门限端点检测顾名思义需要两级检测,在开始检测之前需要设定 $ 个门
剩余10页未读,继续阅读



















安全验证
文档复制为VIP权益,开通VIP直接复制

评论0