轨迹时空谱特征在语音情感识别中的应用

需积分: 10 0 下载量 174 浏览量 更新于2024-08-13 收藏 955KB PDF 举报
"基于轨迹的时空光谱特征语音情感识别算法是朱艺伟、宋泊东和张立臣在广东工业大学计算机学院的研究成果。该方法创新性地利用语音频谱图中的空间和时间轨迹信息进行情感识别,尤其在噪声环境下表现出更好的鲁棒性。与传统的MFCCs和基频特征提取方法相比,该方法在4类情感识别实验中取得了较高的准确率,并且在语音激活检测方面有显著提升。" 本文提出的语音情感识别算法主要关注如何有效地利用语音信号中的时空信息来提升情感识别的精度。传统的特征提取方法,如梅尔频率倒谱系数(MFCCs)和基频,虽然在许多情况下表现出色,但在噪声环境中可能受到较大影响。而基于轨迹的时空光谱特征方法旨在解决这一问题。 首先,该算法的核心是提取语音频谱图中的空间和时间轨迹描述符。这些描述符能够捕获声音信号在时间和频率域内的动态变化,这在情感表达中至关重要,因为情感往往体现在声音的瞬时变化和模式中。通过这种方式,算法可以更全面地捕捉到声音中的情感线索,特别是在复杂环境下的噪声抑制能力得到增强。 其次,研究采用了穷举特征提取策略,即尝试多种不同的特征组合,以找到最佳的情感识别特征集。这种方法有助于发现不同特征之间的互补性,进一步提高识别的准确性。实验结果证明了这种方法在噪声环境下的鲁棒性,意味着即使在背景噪音较大的情况下,也能保持良好的情感识别性能。 此外,该研究还在4类情感识别任务上进行了实验,包括高兴、悲伤、愤怒和中性等常见情感。通过非加权平均反馈(NWAU),算法表现出了与现有方法可比的性能,表明其在实际应用中具有广泛的可能性。特别是在语音激活检测方面,即确定何时有语音信号存在,该方法也取得了显著的进步,这对于实时的情感识别系统来说是一个重要的改进。 基于轨迹的时空光谱特征语音情感识别算法为情感识别领域提供了一个新的视角,强调了时间和空间信息的重要性,并通过实验验证了其在噪声环境和多情感识别任务中的优越性。这一方法的提出对未来的语音处理和情感识别技术发展具有积极的推动作用。