基于PAD情感模型的维度情感语音数据库优化研究

4 下载量 17 浏览量 更新于2024-09-04 收藏 289KB PDF 举报
情感语音数据库优化及PAD情感模型量化标注 情感语音数据库是情感语音识别研究的基础,建立包含认知心理因素在内的维度情感语音数据库对提高识别率、改善人机交互能力具有重要意义。笔者首先对前期建立的摘引型TYUT2.0数据库进行语音听辨筛选,根据认同率阈值进行数据库优化,得到的情感语音数据库包含四种情感的语句237句,其中"悲伤"62句、"愤怒"58句、"高兴"57句、"惊奇"60句。 PAD三维情感模型是根据认知心理因素对情感进行量化标注的模型,对该数据库语音进行标注,得到维度情感语音数据库。该数据库中的每句语音都有对应的听辨认同率以及PAD值。对每句语音的PAD值进行统计分析,证明了该维度情感语音数据库的有效性,为今后研究维度情感识别奠定了基础。 PAD情感模型是一种基于认知心理因素的量化标注模型,能够对情感语音进行精准的量化标注。该模型将情感语音分为三维:愉快度、激励度和控制度三个维度,对每个维度进行量化标注,得到的情感语音数据库能够满足情感语音识别的需求。 在情感语音数据库优化中,笔者首先对前期建立的摘引型TYUT2.0数据库进行语音听辨筛选,根据认同率阈值进行数据库优化,得到的情感语音数据库包含四种情感的语句237句。然后,笔者利用PAD三维情感模型对该数据库语音进行标注,得到维度情感语音数据库。 该研究的主要贡献在于:(1)建立了包含认知心理因素在内的维度情感语音数据库,提高了情感语音识别的准确性。(2)提出了基于PAD三维情感模型的量化标注方法,能够对情感语音进行精准的量化标注。(3)证明了该维度情感语音数据库的有效性,为今后研究维度情感识别奠定了基础。 该研究的结果对情感语音识别研究具有重要意义,对提高情感语音识别的准确性和改善人机交互能力具有重要影响。同时,该研究也为今后研究维度情感识别奠定了基础,对提高人类-机器交互能力和智能化程度具有重要意义。 本研究的主要贡献在于建立了包含认知心理因素在内的维度情感语音数据库,并提出了基于PAD三维情感模型的量化标注方法,证明了该维度情感语音数据库的有效性,为今后研究维度情感识别奠定了基础。