基于ZCPA特征的多种前端滤波器语音识别鲁棒性研究

1 下载量 3 浏览量 更新于2024-09-07 1 收藏 517KB PDF 举报
多种前端滤波器的ZCPA对语音多变性的鲁棒性研究 在语音识别领域中,鲁棒性研究是一个非常重要的课题。语音识别系统的鲁棒性不仅仅受到噪音的影响,还受到语音多变性的影响。为了提高语音识别系统的鲁棒性,需要研究不同前端滤波器对语音多变性的鲁棒性影响。本文研究了FIR滤波器、Gammatone(GT)滤波器、Laguerre滤波器和弯折滤波器(WFBs)对语音多变性的鲁棒性影响,使用支持向量机(SVM)作为后端识别系统。 首先,我们需要了解什么是语音多变性。语音多变性是指同一个speaker在不同的说话方式下语音的变化,例如快语音、慢语音、大声语音、温柔语音等。这些变化会对语音识别系统的鲁棒性产生影响。为了研究语音多变性的鲁棒性,我们需要选择合适的前端滤波器和后端识别系统。 在本文中,我们选择了FIR滤波器、Gammatone(GT)滤波器、Laguerre滤波器和弯折滤波器(WFBs)作为前端滤波器,使用支持向量机(SVM)作为后端识别系统。实验结果表明,在语音多变性的识别中,SVM系统较常用的HMM系统更适于ZCPA特征;并且在SVM系统下,ERB尺度的弯折滤波器较其他前端滤波器识别效果更好,明显优于常用的MFCC特征。 在语音识别领域中,前端滤波器的选择是非常重要的。不同的前端滤波器对语音信号的处理方式不同,对语音识别系统的鲁棒性也不同。FIR滤波器是一种常用的前端滤波器, Gammatone(GT)滤波器是一种生物启发式滤波器, Laguerre滤波器是一种基于数学模型的滤波器,弯折滤波器(WFBs)是一种基于耳蜗模型的滤波器。每种前端滤波器都有其优缺,选择合适的前端滤波器对于语音识别系统的鲁棒性非常重要。 在本文中,我们还讨论了支持向量机(SVM)作为后端识别系统的优点。SVM是一种基于统计机器学习的识别系统,对语音识别任务有着很高的鲁棒性。SVM系统可以很好地处理语音信号中的噪音和变异,从而提高语音识别系统的鲁棒性。 本文研究了多种前端滤波器对语音多变性的鲁棒性影响,结果表明在语音多变性的识别中,SVM系统较常用的HMM系统更适于ZCPA特征;并且在SVM系统下,ERB尺度的弯折滤波器较其他前端滤波器识别效果更好,明显优于常用的MFCC特征。这项研究结果对于语音识别系统的鲁棒性研究有着重要的意义。