基于统计模型的语音激活检测算法改进基于统计模型的语音激活检测算法改进
语音激活检测技术是应用于语音侦听领域降低节点能耗的关键技术之一,其核心是语音激活检测算法。针对基
于统计模型的语音激活检测算法仅采用当前语音帧的参数来判断有无语音信号而带来的误检率高的问题,提出
用相邻语音帧逻辑与运算的方法对其进行改进。试验表明:改进后的算法在误检率上明显低于改进前,提高了
语音信号检测的准确性,有效地降低了节点能耗。
摘摘 要要:
关键词关键词: 统计模型;语音激活检测;检测算法
0 引言引言
语音激活检测技术是利用语音激活检测算法,仅当检测到语音信号时激活节点,使之从休眠状态转换到工作状态,其余时
间处于休眠状态,是降低节点能耗的关键技术之一。基于统计模型的语音激活检测算法,通过选取特征参数建立统计分布模
型,根据当前帧的信息计算出模型中的未知参数,得出判决准则,并据此判断有无语音信号[1]。其优点是能够适应时变噪声
的特点,在复杂环境下,检测的准确率较高[2-4]。但只根据当前语音帧的参数来判断有无语音信号具有一定的局限性,极易出
现误判的情况。因此,对基于统计模型的语音激活检测算法加以改进来降低误检率,对语音侦听领域具有十分重要的意义。
1 基于统计模型的语音激活检测算法基于统计模型的语音激活检测算法
1.1 算法的基本步骤算法的基本步骤
基于统计模型的语音激活检测算法[2-3,5]以贝叶斯定理和似然比检验为基础,检验过程分提出假设、分析参数和检验判
决三步。
1.1.1 提出假设
待测音信号X有两种假设:一是只有噪声N存在,则原假设H0为真,判定未检测到语音;二是语音S与噪声N同时存在(S
与N互不相关),则备选假设H1为真,判定检测到语音,可以描述为:
H0∶X(t)=N(t)(1)
判定不存在语音信号。
H1∶X(t)=N(t)+S(t)(2)
判定存在语音信号。
1.1.2 分析参数
首先要根据其频率特征进行周期性采样,使波形参数由连续时间序列变为离散时间序列。然后根据采样信号的振幅绝对值
描绘直方图,计算概率密度表达式,将模拟的语音信号用数字参数表示出来[1]。第t帧加噪信号、纯语音信号和噪声信号的离
散傅里叶变换系数如下。
X(t)=[X0(t),X1(t),…,XM-1(t)]T(3)
S(t)=[S0(t),S1(t),…,SM-1(t)]T(4)
N(t)=[N0(t),N1(t),…,NM-1(t)]T(5)
在X(t)、S(t)、N(t)中,第k个谱分量的系数分别为Xk、Sk和Nk。用Xk(R)和Xk(I)分别表示离散傅里叶变换
系数Xk的实部和虚部,假设每个DFT系数的实部和虚部都服从拉普拉斯概率密度函数,如果其实部和虚部的方差相同,则
Xk(R)和Xk(I)的概率密度分布如式(6)和式(7)所示。
其中, 是指Xk方差的平方根。因为Xk的实部和虚部近似独立,其方差可以看作相等,则Xk的概率密度函数可以表示
为[1,6]:
H0和H1的条件概率密度函数分别为: