语音情感识别研究:希尔伯特黄变换与特征提取

需积分: 49 8 下载量 27 浏览量 更新于2024-08-06 收藏 8.47MB PDF 举报
"这篇硕士论文主要探讨了语音情感特征的提取与识别技术,结合Solution Fourier Analysis Stein的方法,针对语音情感识别这一领域进行了深入研究。作者向磊在导师熊卫华副教授的指导下,专注于控制理论与控制工程领域的工业过程控制与综合自动化方向。论文详细总结了以下内容: 1. 语音情感识别的重要性:随着信息技术和人工智能的发展,语音情感识别在多个领域,如科学研究、生产实践和日常生活中的应用越来越广泛。然而,该领域的研究仍处于初级阶段,存在情感分类标准不一、缺乏多语言和多情感类型的统一情感库、特征提取和识别方法的有效性等问题。 2. 语音情感库的构建:论文详细分析了国际上几个有影响力的语音情感库,如德国的柏林语音情感库、Belfast语音库和中文的汉语语音情感库,并根据语料选择原则,创建了一个包含800条情感语句的自建库,涵盖了高兴、愤怒、恐惧和平静四种情感类型。 3. 希尔伯特黄变换(HHT)在语音情感分析中的应用:HHT作为一种时频分析工具,能更好地揭示非线性非平稳信号的时频分布特性,相较于传统的傅里叶变换,它具有更优的性能。论文通过比较经验模态分解(EMD)和改进版EEMD,证明了EEMD在抗混叠能力上的优势。 4. 情感特征的提取:论文探讨了基音周期、共振峰频率、线性预测倒谱系数(LPCC)和梅尔频率倒谱系数(MFCC)等特征,并提出了基于EEMD和Hilbert边际谱的非线性处理方法。此外,从人耳感知的角度出发,通过临界频带的能量分布分析,提出了情感边际谱,这种特征在关键频段的集中度更高,有助于情感信息的准确提取。 5. 识别方法的研究:论文还研究了人工神经网络、混合高斯模型(GMM)、隐马尔可夫模型(HMM)和支持向量机(SVM)等情感识别方法,但具体内容未在摘要中详述。 这篇论文的工作不仅为语音情感识别提供了新的视角和方法,也为后续研究提供了基础,对于推动该领域的理论发展和实际应用具有重要意义。"