临界小波参数与序列核支持向量机在说话人识别中的应用

需积分: 10 0 下载量 48 浏览量 更新于2024-08-11 收藏 889KB PDF 举报
"这篇论文是2012年由李鉴和李杰发表的,主题是利用基于临界小波参数和新序列核支持向量机(SVM)进行说话人识别。他们工作在可再生希尔伯特空间框架下,提出了一个新的序列核来衡量语音序列的相似性,并且为了解决传统语音短时分析技术可能导致信息丢失的问题,引入了基于临界带宽的小波包变换算法。实验在NIST 2004年的评测数据集上进行,结果显示这种方法能够显著提高识别率。关键词包括小波包变换、临界频带、支持向量机以及说话人识别。" 这篇论文的核心知识点如下: 1. **支持向量机(SVM)**:支持向量机是一种监督学习模型,用于分类和回归分析。在说话人识别任务中,SVM通过构建一个最优超平面来区分不同说话人的语音特征,以实现高精度的识别。 2. **序列核**:在可再生希尔伯特空间框架下,论文提出了一个新的序列核,这个核函数能够有效地度量语音序列之间的相似性,这对于序列数据如语音信号的处理至关重要。 3. **小波包变换**:传统短时分析方法可能丢失语音信号中的关键信息,因此作者采用了基于临界带宽的小波包变换。小波包变换是一种更精细的时间-频率分析工具,它能够在时间和频率域同时提供局部化分析,从而更好地捕捉语音信号的瞬态特性。 4. **临界带宽**:在音频处理中,临界带宽是指人类听觉系统能分辨两个相邻频率最小差别的带宽。在小波包变换中,利用临界带宽可以更好地适应语音信号的频谱特性,有助于提取更具辨别力的特征。 5. **NIST 2004评测数据集**:这是论文中用于验证方法有效性的标准测试集,由美国国家标准与技术研究所提供,通常用于评估语音识别系统的性能。 6. **性能提升**:通过实验,作者证明了他们的方法在说话人识别任务上的表现优于传统的技术,显著提高了识别率,这表明所提出的特征提取和识别方法对于说话人识别有实际应用价值。 这篇论文的贡献在于结合了小波包变换的频率分析优势和SVM的高效分类能力,提出了一种新的序列核,以解决语音识别中的挑战,特别是在减少信息损失和提高识别准确率方面取得了进展。