Journal of Computer Applications ISSN 1001-9081 2020-12-18
计算机应用
CODEN JYIIDU http://www.joca.cn
收稿日期: 2020-09-14; 修回日期:2020-10-24; 录用日期:2020-10-30。
基金项目: 国家自然科学基金(61772282)。
作者简介:章荪(1994-),男,安徽六安人,博士研究生,主要研究方向:深度学习、情感分析、文本分类;尹春勇(1977-),男,
山东潍坊人,教授,博士,博士生导师,主要研究方向:网络空间安全、大数据挖掘及隐私保护、人工智能及新型计算。
文章编号
:1001-9081(****)**-0000-00 doi:10.11772/j.issn.1001-9081.2020091416
基于多任务学习的时序多模态情感分析模型
章荪,尹春勇
*
(南京信息工程大学 计算机与软件学院,南京 210044)
(*通信作者电子邮箱 yinchunyong@hotmail.com)
摘 要: 针对时序多模态情感分析中存在的单模态特征表示和跨模态特征融合问题,结合多头注意力机制,提出一种基
于多任务学习的情感分析模型。首先,结合卷积神经网络、双向门控循环神经网络和多头自注意力实现了对时序单模态的特
征表示;然后,利用多头注意力实现跨模态的双向信息融合;最后,基于多任务学习思想,添加额外的情感极性分类和情感
强度回归任务作为辅助,提升情感评分回归主任务的综合性能。通过实验结果可以证明,所提模型在二分类准确度指标上,
相较于多模态分解模型,在 CMU-MOSEI 和 CMU-MOSI 多模态数据集上分别提高了 7.8 和 3.1 个百分点。因此,该模型适用
于多模态场景下的情感分析问题,能够为商品推荐、股市预测、舆情监控等应用提供重要的决策支持。
关键词: 情感分析;多模态;多任务学习;序列学习;特征融合
中图分类号:TP391.1 文献标志码: A
Sequential multimodal sentiment analysis model based on
multi-task learning
ZHANG Sun, YIN Chunyong
*
(1. School of Computer and Software, Nanjing University of Information Science and Technology, Nanjing Jiangsu 210044, China)
Abstract: Considering the issues of unimodal feature representation and cross-modal feature fusion in sequential multimodal
sentiment analysis, a multi-task model was proposed based on multi-head attention mechanism. Firstly, convolution neural network,
bidirectional gated recurrent neural network and multi-head self-attention were integrated for sequential unimodal feature
representation. Secondly, bidirectional cross-modal information was fused by multi-head attention. Finally, sentiment polarity
classification and intensity regression were designed as additional auxiliary tasks to improve the performances of main sentiment score
regression task based on multi-task learning. Experimental results can demonstrate that proposed model has improved accuracy rate by
7.8 and 3.1 per cents respectively on CMU-MOSEI and CMU-MOSI datasets, compared with multimodal factorized model. Therefore,
the proposed model has provided valuable decision supports for product recommendation, stock market forecasting, public opinion
monitoring and other relevant applications.
Keywords: sentiment analysis; multimodal; multi-task learning; sequential learning; feature fusion
0 引言
情感分析主要涉及检测、分析和评估用户面对不同事件、
问题、服务时所产生的心理状态,它是实现智能化人机交互
的必要条件
[1]
。社交网络作为新兴的信息媒体,允许用户上
传和分享日常的生活经历和观点看法。这些自用户端发布的
数据含有丰富的情感信息,能够为情感分析提供重要的数据
支持
[2]
。因此情感分析相关的工作大多以社交网络为背景,
利用用户生成数据训练情感分析模型。
现有的情感分析研究主要集中于单一的文本模态,它伴
随着统计学习和人工智能技术的发展得到了不断地完善。文
本情感分析的关键在于构建有有效的文本特征表示。早期方
法通常基于词汇的情感信息,提取词语统计特征作为文本表
示,利用机器学习方法实现进一步的分类和预测。而自深度
学习兴起后,研究者提出利用卷积神经网络(Convolution
Neural Network, CNN)
或 循 环 神 经 网 络
(Recurrent Neural
Network, RNN)端到端提取文本的空间和时序信息,或是利用
预训练的语言模型将高维的稀疏特征映射到低维的语义空
间,学习文本的嵌入表示。深度学习解决了传统统计方法中
存在的维度爆炸和特征稀疏问题,但是这些方法通常只关注
于单一的模态信息,不能适应多模态的社交网络环境。
每一种信息的来源或形式都可以看作是一种模态,社交
网络正是由文本、图像、语音等多种模态构成的复杂环境
[3]
。
www.joca.cn