GSITK：情感分析框架的开发和复制的软件工具（2022）-马德里理工大学研究者的贡献

192 浏览量更新于2024-01-25 收藏 454KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

软件X 17（2022）100921原始软件出版物GSITK：一个用于敏捷复制和开发的情感分析框架Oscar AraqueP.，J. Fernando Sánchez-Rada，Carlos A. Iglesias马德里理工大学，智能系统集团，西班牙ar t i cl e i nf o文章历史记录：接收7七月2021收到修订版2021年11月19日接受2021年11月22日关键词：情感分析词嵌入机器学习自然语言处理a b st ra ctGSITK是一个执行各种情感分析任务的框架，包括数据集获取、文本预处理、模型设计和性能评估。该框架面向研究人员和从业人员，简化了以前情感模型的复制，并提供了常见任务的实现。这是通过在流行的库（如scikit-learn和NLTK）上构建几个抽象来实现的。通过这种方式，GSITK允许用户使用可理解的Python代码实现该框架是开源的，并已成功地用于几个研究项目和比赛。版权所有©2021作者。由爱思唯尔公司出版这是CC BY许可下的开放获取文章（http://creativecommons.org/licenses/by/4.0/）中找到。代码元数据当前代码版本v0.2.4指向代码/存储库的永久链接，用于此代码版本https://github.com/ElsevierSoftwareX/SOFTX-D-21-00125法律代码许可证Apache许可证，版本2.0使用git的代码版本控制系统使用Python的软件代码语言、工具和服务编译要求，操作环境依赖性Python 3.6+，NumPy，Pandas，NLTK，Scikit-learn，gensim，pyyaml，pytreebank如果可用开发人员文档/手册链接https://gsi-upm.github.io/gsitk/问题支持电子邮件o. upm.es软件元数据当前软件版本0.2.4此版本可执行文件的永久链接https://github.com/gsi-upm/gsitk/tree/0.2.4法律软件许可证Apache许可证，版本2.0计算平台/操作系统Linux，OS X，Microsoft windows，类Unix安装要求依赖Python 3.6+，NumPy，Pandas，NLTK，Scikit-learn，gensim，pyyaml，pytreebank用户手册链接https://gsi-upm.github.io/gsitk/问题支持电子邮件o. upm.es1. 介绍情感分析解决了人类生成的文本中表达的态度，观点和情感的启发。这一研究和应用领域正在扩大，*通讯作者。电子邮件地址：o.araque@ upm.es（Oscar Araque），jf.sanchez@ upm.es（J.Fernando Sánchez-Rada），carlosangel. upm.es（Carlos A.伊格莱西亚斯）。https://doi.org/10.1016/j.softx.2021.100921社交媒体的发展以及为大量在线内容添加背景和知识的需求[1]。近年来，人们进行了大量的研究，以推动最先进的技术向前发展，但不幸的是，复制和比较仍然是复杂和耗时的任务。所提出的软件，GSI工具包（GSITK），是一个框架，有利于开发和评价的情绪和情感模型。它管理数据集、特征、分类器和评估技术，提供了一些抽象和实用程序。除此之外，GSITK还包括几个实现2352-7110/©2021作者。由Elsevier B.V.出版。这是一篇开放获取的文章，使用CC BY许可证（http://creativecommons.org/licenses/by/4.0/）。可在ScienceDirect上获得目录列表SoftwareX期刊主页：www.elsevier.com/locate/softxOscar Araque，J. Fernando Sanchez-Rada and Carlos A. Iglesias软件X 17（2022）1009212在以前的作品中已经彻底评估的情感模型，允许用户使用这些模型而无需重新实现它们。2. 问题和背景情感分析开发是一项复杂的任务，需要不同领域的专业知识：数据处理，软件工程，统计学和机器学习。正因为如此，设计一个正式的开发和评估方法是一项耗时的任务.此外，它通常需要重复几个步骤，如数据集获取，文本预处理和规范化。另一个相关的问题是应该如何重新利用复杂的模型。通常情况下，研究工作介绍和评估一个新的模型，提高了最先进的。不幸的是，最初的实现并不总是发布的，或者复制它是不可能的。这些困难是阻碍该领域进展的一个相关问题鉴于此，GSITK旨在提供抽象和经过测试的实现，以简化感测分析模型的开发和评估。它还包括几个可以直接使用的参考模型，这有助于研究人员和开发人员复制现有的工作。有几个从文献中发送分析模型的公开可用的实现。例如，CoreNLP[2]包括递归神经张量网络（RNTN）模型[3]。在这方面的工作中，其他作者 [4] 提出并发表了一个使用语义学并基于SentiWordNet的情感分析模型[5]。另一个相关的工作是模式[6]，它包括自然语言处理（NLP）功能，近年来一直是一个流行的工具然而，仍然需要更同质的软件框架。情感分析领域在NLP中已经突出了几年，它仍然是一个活跃的领域。情感分析最突出的方面之一是多模态系统的研究[7]，它结合了不同的模式（例如，文本、音频、视频）以提高检测精度。例如，[8]生成了一个完整的情感多模态数据库，遵循严格的情感诱导协议，并结合了许多模态。有趣的是，在[9]中，作者通过对电影内容进行多模态研究，探索了情感内容分析和诱导情感识别之间的差距缺少模式的问题在实际案例中很常见，但尚未得到彻底研究。以前的工作[10]通过调整多模态张量来指导每个模态的演变来解决这个问题为了探索使用基于词汇知识的特征提取方法，[11]使用SenticNet [12]来提取自然语言概念，从而提高效价预测的准确性。在知识表示方面，情感分析可以大致分为符号和子符号方法[12]。符号方法的目的是生成文本分析的知识库。这些资源的一些例子是WordNet-Affect [13]和SentiWordNet [14]，两者都构建在WordNet资源之上[15]。此外，SenticNet [12]是符号方法的一个例子。子符号方法通过机器学习利用统计推断。在这一领域，深度学习的使用将情感分析系统推向了新的前沿。上述递归神经张量网络（RNTN）通过使用递归结构来组成句子的情感，从而利用神经网络的学习能力。当使用神经网络来引发情绪时，一个有趣的方法是注意力。注意机制可以帮助识别焦点词以发现情绪。因此，[16]应用注意方法研究体水平上的情感注意力层可以堆叠，如[17]所示，它使用具有分层注意力机制的长短期记忆（LSTM）网络来结合目标级和任务级注意力。此外，注意力可以用于混合网络，如基于注意力的双向CNN-RNN深度模型（ABCDM）[18]。该模型提取过去和未来的文本上下文，允许注意层强调相关的单词。另一项工作[19]探索了在依赖解析树中获得的语言图上使用注意力，这可以改善方面和意见词之间的联系。一种使用注意力的流行模型是来自变压器的双向编码器表示（BERT）[20]，这是一种语言表示模型，可以很容易地微调到情感分析等后验任务。最近使用BERT进行情感分析可以在[21]中找到，它将这种语言模型与传统的机器学习方法相结合。在结合不同模型的过程中，一些作品分析了使用集成技术来提高情感准确性[22]。一个例子可以在[23]中找到，其中一个合奏训练卷积网络来预测社交网络消息上的情绪。此外，在[24]中使用了结合深度和经典学习模型的堆叠集成，在两个不同的应用领域中优于以前的作品情感分析方法通常将文本分类为极性（积极，消极，中性），尽管有时不考虑中性，因为它被认为是无信息的。通常情况下，多数票是使用不同的预测-ent模型，以提高中立性检测和过滤。通过这种方式，[25]引入了基于模糊多数的加权平均算子，用于组合来自多个情感分析模型的预测。类似的工作[26]显示了来自不同模型的预测的聚合如何优于单个模型。在[27]中，作者表明，当一个特定的极性占主导地位时，中性文本的分析变得更加相关，有助于理解和分析特定的框架。最后，在[28]中，提出了一个处理中性极性的矛盾心理的系统，为所涉及的情感和情绪提供了更精确的表征3. 软件框架3.1. 软件构架从总体上看，GSITK由五个模块组成，涵盖了执行情感分析研究工作所需的操作，并按其功能划分。所有这些模块都提供了情感分析中常用的实用程序和方法实现，可以单独使用或组合使用。GSITK中包含的子模块有：（1）数据集管理，包括常用数据集的集合;（2）预处理功能，为文本提供各种预处理实用程序，实现情感分析中使用的常用技术;（3）特征提取，包括几种情感分析方法的实现，大大提高了方法的可重复性;（4）评估，其实现若干评估方法;以及（5）分类器和估计器，用于情感分析的预先训练的分类器和估计器的集合。3.2. 软件功能GSITK的主要特点是：Oscar Araque，J. Fernando Sanchez-Rada and Carlos A. Iglesias软件X 17（2022）1009213×数据集下载和管理。该子模块允许用户下载情感分析和管理中常用的几个数据集，以供以后的实验使用。这些功能简化了情感分析方法的可复制性GSITK提供了12个已经处理过的数据集，可以通过一行代码访问。相关的例子是IMDB电影评论[29]，SST [3]和PL05 [30]。文本的预处理功能。促进预处理允许用户投入时间在其他任务。更具体地说，GSITK提供了三种类型的预处理：– 面向Twitter的预处理，改编自[31]中执行的预处理– 简单的基于regex的标记化和字符串清理，改编自[32]。该模块旨在处理大型数据集，因为它具有较低的处理时间。– NLTK1适应标记化和噪声消除。该模块用于处理较小的数据集，因为它具有较高的计算成本。– 嵌入技巧预处理[33]，包括使用单词嵌入模型将某些单词替换为其他单词这种方法可以在利用词典资源时使用，将单词映射到受限的词汇表。机器学习的特征提取，实现了文献中提出的几种方法这包括以下型号：– 基于Word和文档嵌入的功能，如[22]所示。– 基于相似性的情感投射（SIMON）模型[34]。– [35]如[22]中所使用的特定情感词嵌入（SSWE）模型[35功能持久性，允许用户将功能集持久化到磁盘。此功能在长特征提取过程中非常有用。不同分类器和估计器的内置实现。这大大减少了某些任务的开发时间。更具体地说， GSITK 包含了Valence AwareDictionary and software Reasoner（VADER）[36]模型的实现，以及通过平均注释来有效实现词典使用。评估工具和流程，涵盖情感分析中的典型评估程序。GSITK允许用户按照通常的做法对方法和算法进行合理的评估。特别是，GSITK提供了一个接口，包括训练/测试和交叉验证评估。这个界面是可配置的，它允许用户快速开发一个良好的评估环境。3.3. 用途：word2vec特征提取GSITK可用于从文本中提取基于word2vec的特征，如清单1所示。提取的特征可以直接用于训练机器学习算法来预测情感。首先，第2行导入Word2VecFeatures类[22]，它实现了从word2vec预训练模型中提取特征。在第4-7行中，定义了一个示例数据集。接下来，第10行调用GSITK的一个这一步在大多数NLP任务中很常见。1 https://www.nltk.org/网站。接下来，第14w2v_model_path表示所使用的单词嵌入模型的文件路径; w2v_format声明要使用的单词嵌入格式;卷积值为[1，0，0]表示仅使用平均池化函数。关于最后一个参数，可以组合不同的池化函数例如，[1，1，0]表示使用平均值和最大值函数最后，第19行从预处理的文本中提取特征结果变量X包含一个维度为n m的数组，其中n是文档的数量，m是单词嵌入模型的维度。1234567891011121314151617181920清单1：使用word2vec特征提取的示例代码4. 执行GSITK软件使用Python 3和开源库实现仓库可以在GitHub2上找到，Apache许可证2.0。在实现方面，它使用scikit-learn库3，并通过遵守Pipeline4实现来扩展其功能。此外，单词嵌入功能使用gensim。5对于某些NLP方法，使用NLTK。安装可以通过PyPI/pip完成，也可以使用git手动完成。还提供了几个Docker6镜像用于开发，测试，便于在不同的机器之间复制。关于测试，这些功能涵盖了使用pytest进行的广泛测试。7此外，GSITK与Senpy [37]完全兼容，Senpy是一个开发、评估和发布Web服务的框架，用于文本中的情感和情绪分析。可以使用GSITK评估Senpy服务，为情感分析开发、评估和使用提供统一的框架。5. 实证结果本节描述了两种不同的机器学习模型的经验评估，这些模型被对于这个评估，我们使用GSITK提供的几个功能（第3.2节）：数据集加载和预处理，1 https://github.com/gsi-upm/gsitk网站。2 https://scikit-learn.org/stable/网站。3 https://scikit-learn.org/stable/modules/classes.html#module-sklearn的网站。渠道.4 https://radimrehurek.com/gensim/5 https://www.docker.com/网站。6 https://docs.pytest.org/en/stable/网站。从GSITK。preprocesimprtsimple从GSITK。我知道了。word2vecimportword2VecFeatures文本=[’]#预处理文本texts=[simple. 为[xtt#pathisettoaWord2Vecmodel#convolutionparameterencodespolingoperation[average，maximum，minimum]w2v_extractor=Word2VecFeatures（w2v_model_path=path，w2v_format=X=w2v_extractor。transform（texts）#X is和包含提取特征的······Oscar Araque，J. Fernando Sanchez-Rada and Carlos A. Iglesias软件X 17（2022）1009214表1数据集基本统计：正例数、负例数、总实例数、平均字数。Sentiment 140 Vader STS-金色积极800,0002,901632负800,0001,2991,402总1,600,0004,2002,034Avg. #单词151616表2对拟议方法和数据集的评价结果方法维德STS-黄金GSITK：W2V88.0183.47GSITK：西蒙85.1278.68GSITK：W2V + SIMON90.4082.33CoreNLP60.1959.68水务署77.7575.35图案85.9882.86提取和评估配置。有关详细信息，请在线查看文档。8我们使用三个数据集进行训练和评估：Senti-ment 140[38]，Vader，hutto 2014 vader和STS-Gold[39]。这些数据集在情感分析社区中是众所周知的，代表了任务的相关示例。表1列出了它们的主要特征。选择用于评估的两种机器学习模型在文本表示方面有所不同。首先，我们考虑一个模型，该模型计算每个文档中出现的词向量的平均组合，如[22]中所提出的。在实验中，第一个模型被命名为W2V，因为它使用了一个预先训练好的word2vec模型。清单1显示了GSITK实现的基本用法。其次，我们评估SIMON模型，该模型通过将文本的单词投影到选定的情感词典来计算文本表示[34]。此外，我们还通过两种方法的特征串联来评估组合。这些方法被馈送到逻辑回归方法，该方法使用Sentiment140数据集进行训练。然后在Vader和STS-Gold数据集上评估所得性能，用作测试数据。word 2 vec skip-gram模型[40]已被选为默认的单词嵌入模型。它是通过在Sentiment140数据集上进行无监督训练获得的至于SIMON法，我们选择Liu资源[41]，遵循[34]的经验表2显示了评估中获得的平均f分数从结果可以看出，一般来说，所研究的方法在两个数据集上表现得相当好此外，我们观察到，方法的组合改进了维德数据集，并在STS-黄金的情况下接近有许多工具和软件可以实现邮件分析模型。在这项工作中，我们比较了其中三种工具的性能：CoreNLP [2]，Sentiment WSD[4]和pattern [6]。表2显示了所提出的方法优于这些软件替代品。此外，有趣的是6. 说明性实例用户可以浏览GSITK项目文档，9其中载有详细信息。它包括一个功能以及对用户的说明此外，文档中还包含许多代码示例，说明如何使用该软件，甚至在其上构建应用程序。我们认为评估部分10特别有趣，因为它详细介绍了GSITK评估管道7. 影响Python是当今科学界普遍使用的编程语言。科学Python用户可以轻松地使用简单的脚本或大型程序，促进可重复性并允许科学进步。所展示的软件GSI Toolkit（GSITK）构建在广泛使用的Python科学计算库之上，如scikit-learn，NumPy和pandas。由于GSITK遵循上述库所提倡的通用代码约定，变得简单所提出的软件解决了情感和情绪分析的NLP模型的开发和评估，重点是所产生的软件和模型的可用性和可复制性。GSITK包括各种预处理实用程序，这些实用程序对大多数NLP应用程序都很常见，允许用户避免代码重复。最重要的是，GSITK软件实现了几个特征提取模型，这是一项宝贵的资产。除此之外，所呈现的软件包括MG和SSWE模型的实现[22，35]，SIMON模型的参考实现[34]以及单词嵌入技巧技术的有用抽象[33]。此外，GSITK的几个模型和实用程序已成功地用于国际竞争。例如，在SemEval 2019国际比赛的任务5中，使用所提出的软件的团队在西班牙子任务A中获得了第五名[43]。在IberLEF 2021国际比赛中，GSITK [44]被获得第一名的团队使用。8. 结论本文提出的框架提供了功能和模型实现，以帮助研究人员和专家在情感分析任务，包括数据集获取，文本预处理，模型设计和性能评估。此外，当考虑到这一领域的复制困难时，GSITK是一个有价值的工具，可能会补充其他软件。从这个意义上说，GSITK竞合利益作者声明，他们没有已知的竞争性财务利益或个人关系，可能会影响本文报告的工作致谢作者想确认这项工作是由西班牙科学和创新部通过Cognos项目资助的，参考编号为PID 2019 - 105484 RB-I 00。1 https://gsi-upm.github.io/gsitk/evaluation/#advanced-evaluation。2 https://gsi-upm.github.io/gsitk/网站。10https://gsi-upm.github.io/gsitk/evaluation/。Oscar Araque，J. Fernando Sanchez-Rada and Carlos A. Iglesias软件X 17（2022）1009215引用[1] 刘湾情绪分析：挖掘观点、情绪和情感。剑桥大学出版社 ; 2020 ，http://dx.doi.org/10.1017/CBO 9781139084789。[2] [10]杨文，李文.斯坦福自然语言处理工具包。第52届计算语言学协会年会论文集：系统演示。2014年，第55-60页。http://dx.doi.org/10.3115/v1/P14-www.example.com[3] Socher R，Perelygin A，Wu J，Chuang J，Manning CD，Ng AY等人。2013年自然语言处理经验方法会议论文集。2013. p. 1631-42年。[4] Cagan T，Frank SL，Tsarfaty R.生成对社交媒体中有观点的文章的主观反应：一个基于XML的架构和一个图灵测试。在：在社交媒体的社会动态和个人属性的联合研讨会的会议记录。巴尔的摩，马里兰州：计算语言学协会; 2014年，第58-67页。http://dx.doi.org/10.3115/v1/W14-2708。[5] Esuli A，Pastiani F. Sentiwordnet：一个公开可用的词汇资源，用于意见挖掘。在：LREC。卷六、2006年。p. 417-22[6] De Smedt T ， Daelemans W. Python 的模式。 J Mach Learn Res2012;13（null）：2063-7.[7] [10]张世荣，张世荣，张世荣.一项调查多模态情感分析Image Vis Comput2017;65：3-14. 网址：//dx.doi.org/10.1016/j.imavis.2017.08.003网站。[8] 张文辉，张文辉，张文辉. 用于情感识别和隐式标记的多模态数据库。IEEETrans Affect Comput 2012;3 （ 1 ）： 42-55. http://dx.doi.org/10.1109/T-AFFC.2011.25网站。[9] Muszynski M，Tian L，Lai C，Moore JD，Kostoulas T，Lombardo P，etal.从多模态信息中识别电影观众的诱导情绪。IEEE Trans Affect Comput2021;12（1）：36-52. http://dx.doi.org/10.1109/TAFFC.2019.2902091.[10]彭伟，洪翔，赵刚.可分离多模态情感分析的自适应模态提取。IEEE Intell Syst2021;36（3）：82-9. 网址：//dx.doi.org/10.1109/MIS.2021.3057757网站。[11]Stappen L，Baird A，Cambria E，Schuller BW.视频传输中的情感分析与主题识别IEEE Intell Syst 2021;36（2）：88网址：//dx.doi.org/10.1109/MIS.2021.3062200网站。[12]李英，邢福忠，郭克良，李文龙. Senticnet 6：符号和子符号人工智能在情感分析中的应用。第 29 届 ACM 信息知识管理国际会议论文集。 CIKMhttp://dx.doi.org/10.1145/3340531.3412003网站。[13]Strapparava C，Valitutti A. WordNet Affect：WordNet的情感扩展.第四届语言资源与评价国际会议论文集。LREChttp://www.lrec-conf.org/[14]Baccianella S，Esuli A，Patitiani F. sentiwordnet3.0：用于情感分析和意见挖掘的增强型词汇资源。在：Lrec.第10卷。2010. p. 2200-04[15]佐治亚州米勒Wordnet：英语词汇数据库。Commun ACM1995;38（11）：39-41.[16]Liu Q，Zhang H，Zeng Y，Huang Z，Wu Z.基于方面的情感分析的内容注意力模型。在：2018年万维网会议的会议记录。WWW '18，国际万维网会议指导委员会，日内瓦共和国和州， CHE; 2018 年，第 1023-32 页。http://dx.doi.org/10.1145/3178876.3186001网站。[17]作者：Ma Y，Peng H，Cambria E.有针对性的基于方面的情感分析，通过嵌入常识知识到一个细心的lstm。第32届AAAI人工智能会议2018年p. 5876-83[18] Basiri ME，Nemati S，Abdar M，Cambria E，Acharya UR. Abcdm：一个基于注意力的双向cnn-rnn深度模型，用于情绪分析。Future GenerComputSyst2021;115 ： 279-94.http://dx.doi.org/10 的网站。1016/j.future.2020.08.005，https://www.sciencedirect.com/science/article/pii/S0167739X20309195。[19]王凯，沈伟，杨毅，权晓，王荣.用于基于方面的情感分析的关系图注意力网络。arXiv preprint arXiv：2004. 12362.[20]放大图片作者：J. J. Bert：用于语言理解的深度双向转换器的预训练。arXiv预印本arXiv：1810.04805。[21]Zhang Y，Du J，Ma X，Wen H，Fortino G.基于情感分析的用户评论。Cogn Comput 2021;1114-27. http://dx.doi.org/10.1007/s12559-021-09855-4.[22]Araque O，Corcuera-Platas I，Sanchez-Rada JF，Iglesias CA.在社交应用中使用集成技术增强深度学习情感分析。专家系统应用 2017;77 ： 236-46.http://dx.doi.org/10.1016/j.eswa的网站。2017年2月2日。[23][10]张文辉，张文辉. [S]wisscheese在SemEval-2016任务4：使用具有远程监督的卷积神经网络集成的情绪分类。在：第 10 届语义评估国际研讨会（ SemEVal-2016 ）的会议记录。 San Diego ， California ： Association forComputationalLin-guistics;2016，p.1124-8http://dx.doi.org/10.18653/v1/S16-1173，https：//aclanthology.org/S16-1173网站。[24]Akhtar MS，Ekbal A，Cambria E.你有多紧张使用堆叠集合预测情绪和情感的强度。 IEEEComputIntellMag2020;15 （ 1 ）：64-75.http://dx.doi.org/10.1109/MCI.2019.2954667网站。[25]Valdivia A，Luzíón MV，Herrera F.情绪分析中的中立性基于模糊多数的问题2017年IEEE国际会议模糊系统。2017年，第1-6页。http://dx.doi.org/10.1109/FUZZ-IEEE.2017的网站。8015751。[26]瓦尔迪维亚一、卢松 MV，坎布里亚 E， Herrera F. 共识投票模型用于在情感分析中检测和过滤中性。 InfFusion2018;44：126-35.http://dx.doi.org/10.1016/j.inffus.2018.03.007，https：//www.sciencedirect.com/science/article/pii/S1566253517306590网站。[27] Santos G，Mota VF，Benevenuto F，Silva TH.中立性可能很重要：巴西和美国Airbnb、Booking和Couchsurfing评论中的情感分析Soc Netw AnalMin 2020;10（1）：1-13. http://dx.doi.org/10.1007/s13278-020-00656-5.[28] 王志，何世宝，坎布里亚E.具有矛盾处理的多级精细尺度情感感测。Int JUncertainFutureKnow-BasedSyst2020;28 （ 04 ）： 683-97.http://dx.doi.org/10.1142/S0218488520500294网站。[29]Maas AL，Daly RE，Pham PT，Huang D，Ng AY，Potts C.学习词向量情绪分析。第49届计算语言学协会年会论文集：人类语言技术。美国俄勒冈州波特兰：计算语言学协会; 2011年，第142-50页https://aclanthology.org/P11-1015[30] 彭 B ，李 L. Seeing stars ： Exploiting class relationships for sentimentcategorization with respect to rating scales. arXiv 预印本 cs/0506075 。http://dx.doi.org/10.3115/1219840.1219855网站。[31]Pennington J，Socher R，Manning CD.Glove：单词表示的全局向量sentation。2014年自然语言处理经验方法会议论文集。2014，第1532-43页。http://dx.doi.org/10.3115/v1/D14-1162。[32]Kim Y.用于句子分类的卷积神经网络在：Pro-2014年自然语言处理经验方法会议（Conference on Empirical Methods in多哈，卡塔尔：计算语言学协会 ; 2014 年，第 1746-51 页http://dx.doi.org/10.3115/v1/D14-1181网站。[33]杨文龙，李晓梅，李晓梅. Depechemood++：双语通过简单而强大的技术构建的情感词汇 IEEE Trans Affect Comput2019;1.http://dx.doi.org/10.1109/TAFFC.2019.2934444网站。[34]Araque O，Zhu G，Iglesias CA.基于语义相似性的情感分析的影响词汇。基于知识的系统2019;165：346-59。http://dx.doi.org/10.1016/j.knosys.2018.12.005网站。[35]唐丹，魏芳，杨宁，周明，刘涛，秦波。学习特定情感用于Twitter情感分类的词嵌入收录于：计算语言学协会第52届年会论文集（第1卷：长文）。2014，http://dx.doi.org/10.3115/v1/P14-1146。[36]放大图片作者：Gilbert E.Vader：一个简约的基于规则的情感模型社交媒体文本分析。在：AAAI网络和社交媒体国际会议卷8.第八条。2014年。p.216比25[37]Sanchez-Rada JF，Araque O，Iglesias CA. Senpy：一个用于se的框架情感分析服务。基于知识的系统 2020;190 ： 105-8 。http://dx.doi.org/10.1016/j.knosys.2019.105193，www.sciencedirect.com/science/article/pii/S0950705119305313.[38]作者：A，R，L.Twitter的情感分类使用遥远的监管卷1.一、号12个。CS224N项目报告，斯坦福大学，2009年，p.2009年[39]Saif H，Fernández M，He Y，Alani H. Twitter情绪分析的评估数据集：一项调查和一个新的数据集，STS黄金。第一届社交和表达媒体中的情感和情绪国际研讨会：人工智能的方法和观点1096年2013年。p. 9-21[40]Mikolov T，Chen K，Corrado G，Dean J.向量空间中单词表示的有效估计。arXiv预印本arXiv：1301.3781。[41]胡M，刘B.挖掘和汇总客户评论。In：Proceedings第十届ACM SIGKDD知识发现与数据挖掘国际会议。2004年，第168- 177页。http://dx.doi.org/10.1145/1014052的网站。1014073。[42]BasileV，Bosco C，Fersini E，Debora N，Patti V，Pardo FMR，等.塞姆瓦尔-2019年任务5：在Twitter上检测针对移民和女性的仇恨言论。第13届语义评估国际研讨会计算语言学协会; 2019，p. 54比63Oscar Araque，J. Fernando Sanchez-Rada and Carlos A. Iglesias软件X 17（2022）1009216[43]Benito D，Araque O，Iglesias CA. semeval-2019任务5：语义相似性和词嵌入，用于Twitter上针对移民和女性的仇恨言论的多语言检测。第13届语义评估国际研讨会论文集。2019. p. 396-403[44]Vera Nieto D，Araque O，Iglesias CA. [Gsi]-UPM at iberLEF 2021：通过微调XLM-roBERTA语言模型对西班牙语推文进行情感分析。见：CEUR，编辑。伊比利亚语言评估论坛（IberLEF 2021）的会议记录与西班牙自然语言处理协会会议（ SEPLN 2021 ）共同举办。 2021 ，第 16-ws.org/Vol-2943/emoeval_paper1.pdf

下载后可阅读完整内容，剩余1页未读，立即下载