改进蛙跳算法驱动的神经网络提升语音情感识别性能

需积分: 10 3 下载量 68 浏览量 更新于2024-09-11 收藏 489KB PDF 举报
本文主要探讨了东大赵力教授在《信号处理》期刊上发表的研究,针对神经网络在语音情感识别领域的应用进行了深入探讨。该研究的核心是基于改进的蛙跳算法(SFLA)进行的。蛙跳算法是一种启发式搜索优化方法,通常用于解决复杂的优化问题。原始的蛙跳算法通过模拟青蛙跳跃的行为来探索解空间,但可能存在初期搜索效率低和局部最优陷阱的问题。 作者提出了一种混合蛙跳算法的改进版本,通过增强算法的全局搜索能力。首先,他们利用混沌运动的遍历性特性,这一特性使得算法能够更有效地探索解空间的不同区域,从而提高初始个体的质量。混沌运动具有不可预测性和遍历性,这有助于避免算法陷入局部最优状态。其次,引入了高斯变异策略,这是一种随机变异操作,可以增加算法的灵活性,使其能够在搜索过程中发现新的可能解,进一步提升优化效果。 改进的SFLA算法被与人工神经网络相结合,应用于语音情感识别系统。语音情感识别是自然语言处理的一个子领域,目标是识别说话者的情感状态,如快乐、悲伤、愤怒等。研究者根据情感的维度空间模型,分别分析了情感语音的韵律特征和音质特征,这些特征对于情感识别至关重要。他们特别关注了谐波噪声比(Harmonic Noise Ratio, HNR)这一关键参数,因为其与情感类别有密切关系。 在实验部分,作者对比了BP神经网络(Backpropagation Neural Network)、RBF神经网络(Radial Basis Function Neural Network)和改进的SFLA神经网络在语音情感识别任务中的性能。结果显示,改进的SFLA神经网络表现出显著的优势,其平均识别率分别比BP神经网络提高了9.2个百分点,比RBF神经网络提高了7.9个百分点。这表明,基于改进蛙跳算法的神经网络在语音情感识别方面具有明显的优势,能够提升系统的准确性和效率。 这项研究不仅深入剖析了蛙跳算法的改进策略,而且展示了如何将其有效整合到神经网络架构中,以优化语音情感识别任务。通过引入混沌运动的遍历性和高斯变异,改进的SFLA不仅增强了搜索性能,还为语音情感识别领域的实际应用提供了新的优化工具。