语音信号处理中短时平均能量和短时平均幅度的应用

需积分: 2 2 下载量 190 浏览量 更新于2024-06-11 收藏 4.21MB PPT 举报
短时平均能量和短时平均幅度的主要用途-语音信号处理 短时平均能量和短时平均幅度是语音信号处理中两个非常重要的概念,它们可以用来区分清音段与浊音段、声母与韵母的分界,无声与有声的分界,连字的分界等。此外,它们还可以作为一种超音段信息,用于语音识别中。 短时平均能量分析是指在一小段时间内计算语音信号的能量。其原理是语音信号能量随时间有相当大的变化,特别是清音段的能量一般比浊音段的小得多。短时平均能量分析可以用来区分清音段与浊音段,因为En值大的对应于浊音段,而En值小的对应于清音段。En值的变化,也可以大致判定浊音变为清音或清音变为浊音的时刻。 短时平均幅度分析是指在一小段时间内计算语音信号的幅度。其原理是语音信号幅度随时间有相当大的变化,特别是清音段的幅度一般比浊音段的小得多。短时平均幅度分析可以用来区分清音段与浊音段,因为短时平均幅度大的对应于浊音段,而短时平均幅度小的对应于清音段。短时平均幅度的变化,也可以大致判定浊音变为清音或清音变为浊音的时刻。 窗口选择是短时平均能量和短时平均幅度分析的关键。不同的窗口选择(形状、长度),将决定短时平均能量和短时平均幅度的性质。矩形窗、海明窗等都是常用的窗口选择。矩形窗的主瓣宽度最小,旁瓣高度最高,会导致泄漏现象,而海明窗的主瓣最宽,旁瓣高度最低,可以有效的克服泄漏现象,具有更平滑的低通特性。 窗口长度的选择对短时平均能量和短时平均幅度的分析结果也有很大的影响。如果窗口长度太大,它等效于很窄的低通滤波器,此时随时间的变化很小,不能反映语音信号的幅度变化,信号的变化细节就看不出来;反之,窗口长度太小时,滤波器的通带变宽,随时间有急剧的变化,不能得到平滑的能量函数。通常认为在一个语音帧内,应含有1—7个基音周期为好。 短时平均能量和短时平均幅度是语音信号处理中两个非常重要的概念,它们可以用来区分清音段与浊音段、声母与韵母的分界,无声与有声的分界,连字的分界等。此外,它们还可以作为一种超音段信息,用于语音识别中。