提高鲁棒性和识别率：基于二次残差与改进MCE的说话人识别研究

需积分: 10 93 浏览量更新于2024-09-05 收藏 265KB PDF 举报

该篇论文主要探讨了在说话人识别领域中，通过结合二次残差和改进的MCE模型来提高系统性能。作者严钦云、邱政权和尹俊勋针对特征提取阶段的鲁棒性问题，提出了一种新颖的方法，即从二次残差信号中提取决策特征。传统的特征可能在噪声环境中易受干扰，二次残差技术通过仅在预测残差内操作，减少了对语音共振峰的影响，有助于保持语音信号的频谱结构，从而增强系统在噪声环境下的鲁棒性。在识别阶段，作者改进了MCE（混合高斯模型）模型，以减少计算量和提升运算速度。MCE模型原本在说话人识别中表现出色，但其训练时间较长的问题尤为显著，尤其是当系统包含更多说话人时，计算复杂度会急剧增加。为了解决这个问题，论文提出了一种创新策略，通过优化算法，仅计算部分类别间的判别函数，从而有效降低了计算负担。论文的研究目标是提高说话人在噪声环境下的识别率和系统整体的鲁棒性，同时兼顾计算效率。结果表明，作者的新方法在保持语音质量的同时，显著提升了说话人识别的准确性和稳定性。因此，这项工作对于解决实际应用中的噪声抑制和高效识别问题具有重要的理论价值和实践意义，特别是在文本无关或文本相关的说话人识别任务中。

展开