现代电子技术
年 月 日
第 卷第 期
0 引 言
端点检测算法在语音信号处理领域有着十分重要
的意义
。对语音信号进行准确的端点检测既是提高语
音识别准确率的重要环节,也是提升语音编码效率的关
键。传统的端点检测算法常采用短时能量、短时过零率
和自相关最大值等方法,这些方法在低噪声环境下均能
取得比较好的结果,但在高噪声环境下性能则下降明
显。后来又出现了许多新的方法,如基于谱熵的端点检
测
、基于 (线性预测倒谱系数)的端点检测
、基于
时频方差的端点检测
等方法。这些方法确实提高了在
低信噪比环境下的语音检测率,然而它们仍有不小的改
进空间。由于 ( 频率倒谱系数)较好地反映了
人耳的听觉特性,而 C
复杂度
较好地体现了语音信号
的非线性特性,且基于二者的端点检测方法均被证明具
有良好的检测效果。本文提出一种新的特征 C
,
并将两种特征进行综合,该方法在不同信噪比环境下均
取得良好的效果,较单独使用其中一种特征更具优势。
1 算法描述
改进的 C
复杂度
复杂度是作用于时间序列的一种指标,主要是将信
号分解成规则成分和不规则成分两部分,通过计算其不
规则部分所占的相对比例来反应信号的复杂度特性,就
是 C
复杂度描述的基础
。改进的 C
复杂度,引入了参
数 r,表征超过频谱均方值 r 倍,它更好地反应了时间序
列的随机性。语音信号的 C
复杂度计算步骤如下:
()对语音信号进行预加重、分帧、加窗处理,得到
f
( )
x 。其中预加重系数α ,帧移为帧长的一半,
使用 窗。
()计算语音信号的频谱:
F
( )
k =
∑
x = 0
N - 1
f
( )
x exp
[ ]
-j2πk x N , x = 0,1,2,…,N - 1 ()
式中:
F
( )
k
是
f
( )
x
的离散傅里叶变换;x 是时域变量;
基于改进 C
0
复杂度和 MFCC 相似度的端点检测
许 昊,张二华
(南京理工大学 计算机科学与工程学院,江苏 南京 )
摘 要:为了提高语音端点检测的准确率,提出一种基于改进 C
复杂度和 相似度相结合的端点检测算法。首
先,计算每一帧语音信号的 C
复杂度以及 相似度。然后,结合 C
复杂度与 相似度作为新的特征参数,设置阈值
进行端点检测。对信噪比在 范围内的含噪语音进行端点检测,使用 软件进行仿真实验。实验结果表明,该
方法相对于单独的两种方法提高了检测率,且稳定性更强。
关键词:音信号处理;C
复杂度; 相似度;端点检测
中图分类号: 文献标识码: 文章编号:()
Endpoint detection based improvement of C
0
complexity and MFCC similarity
,
( , , ,)
Abs tract: (), C
() , C
, C
C
Key words: ;C
; ();
收稿日期: