阿拉伯语情感分析方法：提取在线评论中的有价值意见和价值的方法

52 浏览量更新于2024-01-16 收藏 727KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

沙特国王大学学报改进阿拉伯语的情感分析：一种综合方法Belgacem Brahimia， Mohammed Touahriab，Abdelkamel Tarica阿尔及利亚贝贾亚大学精密科学学院信息学系，06000b阿尔及利亚塞提夫1大学计算机科学系，19000塞提夫c阿尔及利亚贝贾亚大学精密科学学院LIMED实验室，06000阿提奇莱因福奥文章历史记录：收到2019年2019年6月22日修订2019年7月29日接受在线预订2019年保留字：文本挖掘意见挖掘情感分类评论提取A B S T R A C T情感分析SA关注的是从文本评论中确定用户然而，从大量非结构化和冗长的文档中挖掘这些意见是一项具有挑战性的任务。在本文中，我们提出了从在线电影评论中提取有价值的意见和价值的方法，以提高阿拉伯语的SA。首先，我们提出了一种方法，探讨了n-gram和skip-n-gram模型在意见分类中的作用。其次，我们研究了一种方法，利用主观的话，如形容词和名词，通过应用词性标注。这两种方法都结合了一个功能减少技术，以提高SA的结果。第三，我们提出了一种方法，试图提取相关的意见，如审查摘要和结论意见。然后，提出了一种组合的方法来增强意见分类结果。第四，提出了一种基于顾客价值模型的顾客意见分析方法在两个数据集上进行的实验结果证明，我们提出的方法是有效的，并提供比基线情感分类器更好的分数。在F-Measure中获得的最佳分类结果达到96%。这些结果也表明，审美因素是阿拉伯语电影评论中最具影响力的因素。©2019作者制作和主办：Elsevier B.V.代表沙特国王大学这是一CC BY-NC-ND许可下的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。1. 介绍今天，互联网提供了一个很好的机会，表达意见和分享经验的不同事件，产品和服务。这些有用的信息来源是非常有趣的互联网用户作出最佳选择购买服务或产品。事实上，意见是重要的，因为它们是独立的，没有偏见，并基于正确的用户使用给定产品或服务的经验。用户阿拉伯语情感分析的大多数研究都是针对社交网络*通讯作者。电子邮件地址：belkacem. yahoo.fr（B.卜拉希米），touahria_yahoo.fr（M。Touahria），Tarikamel59@gmail.com（A. Tari）。沙特国王大学负责同行审查网站和平台，如Facebook和Twitter，而一些有限的阿拉伯语论文则专注于挖掘电影评论领域的观点，因为缺乏与阿拉伯语研究领域相关的资源。此外，与挖掘其他领域中的评论的任务相比，电影评论提出了一个额外的问题。实际上，电影文本评论不仅包含关于电影及其方面（诸如电影和演员）的评论，而且还包括报告所讨论的电影的故事事实和事件的叙事部分。这些信息部分必须被删除，因为它们对意见分类的任务没有贡献（Mountassir等人，2013年）。相反，与电影事件相关的客观部分可能对评论分类的任务产生负面影响（Zhuang等人， 2006年）。在本文中，我们提出的方法提取相关意见，离子，以改善意见分类在电影评论。在第一种方法中，使用了不同的n-gram模型，除了bigram单词，我们还在Arabic语言中引入了skip-ngram方案。据我们所知，这是第一个在情感分类中研究这种表示的工作。实际上，skip-grams模型主要用于语音处理、语言建模和研究困惑的领域（Guthrie等人，2006年）。https://doi.org/10.1016/j.jksuci.2019.07.0111319-1578/©2019作者。制作和主办：Elsevier B.V.代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。制作和主办：Elsevier可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页：www.sciencedirect.comB. 卜拉希米等人/Journal of King Saud University1243第二种方法研究了采用词性（POS）标记来提高电影评论分类的贡献。特别是，我们选择名词，形容词和动词，以确定其在意见分类的重要性。此外，在处理文本评论时，最重要的方面是数据向量的维度。从这个角度来看，我们应用基于词频的特征约简技术来改进SA，以研究其对意见分类结果的影响。第三种建议的意见分类方法试图从文件审查中提取有意义的信息。更具体地说，它旨在从文本评论中挖掘评论摘要、意见结论和电影评论，然后使用词汇方法对它们进行分类。为了从POS方法和语义方法中获得优势，我们提出了一种组合方法，通过合并它们的预测，使用一个搜索规则。虽然在阿拉伯语情感分析的努力，建议的方法，这一研究领域仅限于预测的水平，积极或消极的情绪，而一些先进的解决方案，提出了提取目标方面与他们的相对意见，如在Al-Smadi等人。（2018年）。根据Day George（1990）的观点，消费者更感兴趣的是使用产品的好处，而不是产品的属性和功能。因此，通过了解客户态度的原因消极的）将是非常有价值的，以改善产品质量，并使其适应客户的价值观和偏好。事实上，通过确定影响用户意见的因素来执行这种分析我们研究工作的第二个贡献是提供了一种通过确定影响客户意见的最重要价值来分析客户意见的方法最后，关于数据集提出评估阿拉伯意见挖掘方法，收集电影领域的规模适中相比，在英语。例如，由Rushdi-Saleh等人编制的语料库。（2011）只包含500个文件审查。为了填补这一空白，我们引入了AMRD，阿拉伯语电影评论数据集，一个收集了1000个用阿拉伯语表达的电影评论的控制器-本文的主要内容如下：1. 我们目前AMRD，一个新的语料库的电影评论在阿拉伯语包含1000评论。该数据集是为研究目的而提出的;2. 我们研究了包括skip-gram在内的几种n-gram模型对阿拉伯语观点分类的影响;3. 我们探讨了词性标注在极性分类中的重要性。此外，我们调查的有效性特征约简技术在情感分类阿拉伯语;4. 我们试图确定在分类结果中整合意见结论和审查摘要5. 我们提出了一种利用顾客价值理论分析顾客意见和态度的方法本文的组织结构如下。在下一节中，我们将介绍情感分析的一些背景知识以及这一研究领域的相关工作。在第三部分中，我们描述了我们提出的意见分类方法，包括文档预处理，词性标注和评论摘要。还提出了分析意见的任务。第四部分提供了实验环境和所进行的实验。所得结果在第5节中讨论。最后，对本文的研究工作进行了总结，并对今后的研究工作提出了展望.2. 背景和相关工作2.1. 意见挖掘意见挖掘（OM）或情感分析（SA）是一个最近和活跃的研究领域，旨在自动处理大量的非结构化文本，包括对目标（如产品和服务）的意见，情感，评价和态度。在文献中，我们发现两种主要方法来对文档评论执行情感分类：监督机器学习ML（或基于语料库的方法）（Pang et al.，2002）和基于词汇的方法（或语义方法）（Turney和Littman，2002）。无监督方法有许多优点。首先，语义取向及其强度可以通过使用情感词典和词典如Senti-WordNet（Esuli和Eschtiani，2007）在单词级别上确定。其次，这种方法可以处理一些复杂的问题，如否定和强化的意见挖掘。然而，这些方法需要构建依赖于上下文和领域的词典，并且它们具有低覆盖率，导致对意见预测的性能差。另一方面，监督学习方法使用分类的文本评论来构建分类模型和算法。然后，训练好的模型被用来预测新的文本数据是正面的还是负面的。在监督策略中，通常有两个主要步骤：（i）特征提取/选择和（ii）情感学习/分类（Pang等人，2002年）。传统提出的方法使用词袋（BOW）表示，其中文本评论被转换为词向量，然后由机器学习算法进行预测。由于BOW模型的差的表示，考虑了一些附加的特征类型，诸如词的n元语法（Rushdi-Saleh等人，2011;Shoukry和Rafea，2012 ）和使用词性（ POS ）标记的句法特征（ Abdul-Mageed ，2015）。机器学习技术由于其与无监督技术相比优越的性能结果而被广泛提出和评估（Pang等人，2002年）。当然，有建议的方法，结合监督的方法和词汇的，以增加在阿拉伯语评论的感觉分类性能（El-Halees等人，2011;El-Beltagy等人， 2016年）。2.2. 相关作品在本节中，我们介绍了关于阿拉伯语情感分析的最重要的研究。读者可以在Al-Ayyoub et al.（2019）中找到关于阿拉伯语情感分析的详细调查。我们记得，意见挖掘的目标是提出解决方案，自动提取和分类的意见和评价嵌入在大量的审查文件在网络上。如引言中所提到的，有两种主要的方法来处理情感分析问题：基于语料库的（也称为监督方法）（Pang等人，2002）和基于词典（或无监督）的方法（Turney和Littman，2002）。无监督或语义技术假设评论文本可以被视为一组单词。这些策略利用情感词和词汇资源来预测评论的极性。另一方面，监督策略使用带注释的文档集合来训练机器学习算法。在这种情况下，意见挖掘可以被认为是一个文本分类任务。监督技术通常比无监督技术给出更好的结果（Pang等人， 2002年）。因此，阿拉伯语情感分类中提出的大多数论文都集中在集成了包括二元组和三元组的不同特征类型的监督机器学习方法上（Rushdi-Saleh等人，1244B. 卜拉希米等人/Journal of King Saud University2011; Shoukry 和 Rafea ， 2012; Aly 和 Atiya ， 2013; Duwairi 和 El-Orfali，2014）。我们认为Ahmad（2006）的工作是对阿拉伯语情感分析进行的最早的研究之一。在他们的工作中，作者提出了一个系统，通过使用本地语法提取关于金融文本的情感承载模式。他们的结果表明，他们提出的英语系统在阿拉伯语和中文中运行良好。El Halees in their work（El-Halees et al.，2011）提出了一种将语义分类器与机器学习方法相结合以用于对文档方向进行分类的方法。作者发现，合并分类算法的混合方法提供了80%的最佳准确率。对于电影评论分类，Panget al.（2002）的作者进行了英文评论的原始研究论文。他们采用监督机器学习算法和互联网电影数据库（IMDB）对电影评论进行分类。具体地，使用了机器学习中的三种众所周知的算法，即朴素贝叶斯（NB）、最大熵（MA）和支持向量机（SVM）。他们的结果表明，SVM是最好的分类器在阿拉伯语电影评论分类中，Rushdi-Saleh等人（2011）的研究人员从包含电影评论的网站和博客中创建了阿拉伯语意见语料库（OCA）。如前所述，这个数据集的大小是适度的（500条评论）。研究人员整合了不同的预处理任务，如词干挖掘和n-gram单词生成。实验结果表明，SVM算法的准确率达到了最佳值（90%）。此外，Mountassir等人（2013）的工作在文档级别上探索了阿拉伯语情感分类中的监督机器学习，本研究的结果表明SVM和NB是有效的。调查影响情感预测的因素是Duwairi和El-Orfali（2014）论文的目标，其中探索了文本预处理，文本表示和特征选择元素以预测评论方向。在同一背景下，奥马尔等人的工作。（2014）研究了特征选择技术和机器学习算法对意见分类的影响。当使用SVM分类器时，获得了最好的结果。为了解决阿拉伯语OM领域资源有限的问题，该论文的作者（ElSahar和El-Beltagy，2015）收集了酒店和电影等不同领域的大型数据集。他们的电影评论语料库包括1524条评论。最近，提出了用于阿拉伯语观点挖掘的基于深度学习（DL）的模型（Al-Sallab等人，2017; Medhaffar等人，2017年）。这样的模型被发现是优于传统的机器学习技术相比。在深度学习模型中，使用深度神经网络自动从文本中提取复杂而深刻的特征（Alpaydin，2014）。然而，使用深度神经网络方法是耗时的（Joulin等人， 2016年），需要大量的数据（Mikolov等人， 2013年）。许多采用DL算法的论文进行了Arabic评价。例如，Al-Sallab等人（2017）的研究调查了这些模型在句子层面上的意见分类，结果证明了递归自动编码器模型对句子极性分类的有效性。最后， Ahmed（2018）的工作提出了ArSenticNet，这是一种用于基于概念的情感分析的阿拉伯语词典，包括通过翻译英语SenticNet 4获得的48 k阿拉伯语概念（Cambria等人，2016年）。从这个关于电影评论分类中最相关的研究的简要概述中，我们可以得出结论，为电影评论创建的阿拉伯语文本集合具有有限的大小（OCA数据集（Rushdi-Saleh等人，2011年），只有500条评论）相比英文版（包括2000篇评论）（Pang and Lee，2004）。这促使我们创建一个新的阿拉伯语电影评论语料库此外，阿拉伯语情感分析的相关论文集中在预测评论极性的任务上。然而，与目前的工作相比，他们没有处理分析这些意见的问题3. 方法在本节中，我们详细描述了我们在这项工作中提出的方法。首先，我们解释了文本预处理和评论表示的步骤，包括两种方法：n-gram单词方法和词性标注（POS）方法。在这项研究中还使用了特征缩减技术来优化特征的数量。在此之后，我们描述了从电影评论中提取摘要的方法。我们还详细介绍了提高意见分类的组合方法。最后，提出了基于顾客价值概念的意见分析方法。整个过程如图所示。1.一、3.1. n-gram words方法在收集和注释语料库之后，在情感分类之前必须执行预处理步骤，包括清理评论并去除噪声和不相关的文本。接下来，通过将文本划分为标记（或特征）来执行标记化。该过程的目的是将审查文本转换为向量表示，其中特征的重要性由关于给定文本的权重表示。在文献中，有几种加权方案，其中，我们使用词频逆文档频率（TF*IDF），这是最常用的方案，用于信息检索和文本分类任务。在这种方法中，我们使用两种类型的功能。首先，我们使用了n元语法（Shannon，1948）。单词的n元语法是来自给定文本的n个单词的序列。特别是，我们使用单词的二元组，因为它有助于捕捉有用的信息，如否定（例如，“不好”），强化（例如，“非常好”）和相关的意见，如“好电影”。除了二元语法之外，我们还使用1-skip-bigram来提取文本中出现的常见成对词。例如，给定这句话（这本书很好）。这里提取的二元语法是：（this，book），（book，is）和（is，good），而1- skip二元语法是：（this，is）和（book，good）。利用这种功能类型的效用是捕捉有用的信息错过了二元组。在前面的例子中，相关的意见（book，good）是由1-skip bigrams捕获的。最后，我们结合二元组和1- skip二元组的功能，探索其在情感分类的贡献。3.2. 词性标注方法在文献中，我们可以发现许多研究整合了语言特征，如形容词和副词（Wiebe，2000;Pang et al.，2002; Yu和Hatzivassiloglou，2003;Hu和Liu，2004;Ding和Liu，2007;Abdul-Mageed等人，2012年）。我们记得，POS标注是指为句子中的每个单词（如名词和形容词）分配标签的任务。更具体地说，三个词性标记在我们的研究中使用：形容词，名词和动词。使用形容词和名词组合的核心思想是，名词通常表示实体和方面，如电影和演员，而形容词通常用于表达判断和评价。此外，我们利用二元模型来捕获这种有用的情感，包括方面（名词）及其相关的评价（形容词），如在对（电影，好）。B. 卜拉希米等人/Journal of King Saud University1245Fig. 1. 拟议办法所遵循的步骤。3.3. 特征约简在文本挖掘中，处理大量的特征集是一个很高的计算成本和内存占用.大多数文本分类技术通过删除停止词来减少这一巨大的特征数量。不幸的是，由于两个原因，这对于情感分类不是有效的：首先，剩余的特征数量仍然很大。其次，消除停用词并不是情感分析的好选择，因为停用词列表包含否定词，这可能会影响意见分类性能（Duwairi和Qarqaz，2016）。在这些特征缩减技术中，我们发现词频缩减技术去除了语料库中很少出现的词。事实上，频率小的词对于分类任务来说可能有点用处。在目前的工作中，我们采用这种特征约简技术来研究其对意见预测结果的影响。选择共同特征背后的想法是，用户通常使用关于同一领域（电影）的共享意见词3.4. 意见摘要在这一部分的研究中，我们专注于审查摘要的任务，其目的是从文档评论中生成情感摘要。事实上，电影评论通常很长，并且除了评论者的意见本身之外还包含丰富的其他信息，评论摘要的任务旨在产生一个情感摘要或结论意见，描述作者从文本评论中的总体观点。有两种方法可以提取综述摘要。第一种方法包括提取包含评论者评论的有用句子，对于电影评论摘要，我们考虑了两种情况。第一种情况是非常简短的评论，包含明确的评价词，如“好电影”或简单的“好”。它是出现在评论文本开头或结尾的评论标题和标题的情况。这些评论一般描述了作者的结论性意见。在这种情况下，标题被标识为长度小于四个字的短串。该算法的细节在图二、用于提取意见摘要的第二种情况涉及提取与电影实体相关的显式评论。在这种情况下，我们在评论的每个句子中寻找目标（电影）被明确地评论。为了挖掘关于电影实体的明确意见，我们使用描述电影目标的单词列表（例如“电影”和“系列”）。提取的句子与标题和标题一起构成评论的意见结论。图3示出了所提出的用于电影评论提取的算法。1246B. 卜拉希米等人/Journal of King Saud University图二. 提出了一种综述摘要提取算法。图三. 提出了一种电影评论抽取算法。关于评论摘要的分类，我们采用语义学的方法来确定其极性（积极，消极）。对于摘要中的每个句子，我们使用情感词典计算其情感得分。例如，在下面的句子“这部电影很好”中，找到了明确的意见“好”，得分增加了一分。由于意见挖掘中处理否定问题的困难，如果检测到否定词（如no，not），则忽略意见，并将句子的意见归类为未知。最后，将每个句子的意见得分相加，以确定意见结论的总体类别。概括分类的算法如图所示。四、3.5. 联合入路为了提高意见预测和实现建议的分类器之间的互补性，我们提出了我们提出的意见分类方法的组合。事实上，我们的方法提取电影意见摘要预计目前的优势，提供简洁的意见分类精度高然而，事实上，相当多的评论文本没有意见摘要下的两种形式（标题和明确的评论电影实体），我们的摘要分类的方法将给出较差的结果的情感分类。因此，为了改善意见预测，我们提出了一个组合的两种分类方法。该组合系统在分类级别上将第二种方法（POS）标记与第三种方法（审查摘要）合并。在这种情况下，我们结合这些方法的预测，并通过应用投票规则获得总体意见。在混合分类中，极性的优势顺序如下：”未知的回想一下，方法（POS）标记使用形容词、名词和动词作为特征类型，使用SVM作为分类器，而词法方法对评论摘要进行分类。3.6. 分析客户意见本文的第二个贡献是利用顾客价值模型分析顾客的意见.在con.根据消费者行为研究，“价值观”一词了解消费者所感知的产品的好处是公司制定营销策略的关键问题（赖，1995）。在他们的论文中，作者定义了消费者价值和产品效益的类型学，包括功能价值、社会价值、情感价值、认知价值、审美价值、享乐价值、情境价值和整体价值。Rushdi-Saleh et al. （2011年）指出，阿拉伯国家的文化和政治因素影响了审查者的态度。作者提供了一部名为《反基督者》的电影的例子，这部电影在阿拉伯语博客中被列为负面，而在英语电影数据库IMDB中被认为是正面在这项工作中，我们建议依靠消费者的价值观和意见，我们调查的影响，产品的好处和消费者的价值观的评论家的意见。特别是，我们研究了以下价值观的影响：审美，功利，享乐和规范的阿拉伯电影评论域。为此，我们从文献中收集与顾客价值观相关的词汇。考虑到美学因素，我们将Augustin et al.（2012）论文中的美学词汇翻译成阿拉伯语。关于其他价值相关词汇，由于缺乏资源，为每个产品效益编制种子术语，并使用Microsoft Word和Google translator将获得的词汇翻译成阿拉伯语。1此外，为了扩展我们的顾客价值观词典2我们在表1中列出了每个值的单词列表示例。为了研究消费者价值的每个因素对情感分类的影响，我们单独基于每个词汇相关因素进行意见预测。此外，我们结合所获得的词汇值的情感分类。1https://translate.google.com。2https://www.almaany.com/ar/dict/ar-ar/。B. 卜拉希米等人/Journal of King Saud University1247表1客户价值术语示例。见图4。评审摘要分类算法。表2OCA和ARMD数据集的描述。不良阴性Hedonic Pleasant pos 67Boring negNbr代币94，556 121，392 108，454 108，024实用实用pos 52荒谬的否定道德规范pos 60粗俗的否定4. 实验研究在本节中，我们描述了为了评估我们提出的预测和分析意见的方法的贡献而进行的实验测量分类性能的相应结果详细给出了两个数据集。4.1. 文本采集OCA（Opinion Corpus for Arabic）OCA是Rushdi-Saleh等人提出的公共数据集。（2011年）。这个集合包含500个电影评论文档（250个正面，250个负面），从不同的阿拉伯语网页和博客收集。阿拉伯语电影评论数据集（ARMD）。为了建立我们的语料库AMRD，我们收集了来自不同网页和博客的阿拉伯语电影评论。有罕见的网站是专门在阿拉伯语的电影评论。我们只选择了用现代标准阿拉伯语或阿拉伯方言表达的评论，因为这些评论可以被阿拉伯语母语人士理解，如Rushdi-Saleh等人（2011）所做的那样。网站：el cinema3和cairo，4在2016年4月24日至2016年Jaune 21日期间。我们注意到两个数据集之间没有共同的评论。一些基本的统计数据，这些颜色-表2中给出了选择。4.2. 使用的分类器对于电影评论分类任务，我们首先训练了一个著名的监督学习算法SMO（Sequential Minimum3elcinema.com。4cairo360.com。Optimization）（Platt，1999），SVM的一种实现。实际上，SVM已经证明了其在文本分类（Joachims，1998）、意见挖掘（O 'Keefe和Koprinska，2009）和阿拉伯语情感分类（Rushdi-Saleh等人， 2011年）。4.3. 使用的词汇关于意见结论和总结的分类，我们使用El-Beltagy（2016）中提供的尼罗河大学本词典包含埃及阿拉伯语和现代标准阿拉伯语（MSA）情感词及其方向（积极，消极）。该词典适合我们的任务，因为阿拉伯语电影评论是用MSA和埃及语写的。然而，这个字典是全球使用的，必须适应电影评论的背景。因此，我们排除了描述电影类型的词，如“恐怖”和“犯罪”。此外，与电影方面有关的术语，如4.4. 评价方法交叉验证是用于通过将数据分成两部分来评估和比较机器学习算法的常用技术：一部分用于训练分类模型，而另一部分用于验证模型（Manning et al.，1999年）。在我们的实验中，采用10倍交叉验证来平均性能结果.为了测量我们的分类器的性能，我们使用了F-measure（FM）度量（Matiani，2002），它结合了精度和召回率两个度量。精确度（P）定义为算法分类的正确评论数除以分类文档数，而召回率（Recall）(R)表示算法正确分类的评论数与实际评论数之比。在数学上，我们可以定义F-Measure如下：F-测量1客户价值例如语义类大小数据集OCAARMD审美美容POS286积极负积极负大小250250500500Avr tokens/doc485378216.91216.051248B. 卜拉希米等人/Journal of King Saud University表3使用n-gram模型和OCA上的特征约简的SVM的FM结果特征尺寸特征类型10002000300040005000unigram91.4092.8093.609494.20二元模型9293.209494.2094.20双字母表90.80929494.6096表4使用n元模型和AMRD上的特征约简技术的SVM的 FM结果特征尺寸特征类型10002000300040005000unigram79.6081.9082.6082.8081.20二元模型81.1082.2083.8083.5082.70双字母表80.208283.9083.3083.604.5. 结果所进行的测试说明了两个文本集合上的每个预测方法的意见分类得分。进行我们的方法中描述的预处理步骤。作为特征类型，使用了几种n-gram词模型：unigram、bigram和带有1 skip bigram的bigram（bigram-s）。采用TF*IDF加权方案。表3给出了将SVM应用于OCA的结果。这些结果是针对不同的文本模型和第一频繁词的k值。最佳结果以粗体突出显示。从该表中我们可以看出，对于所有文本表示，仅保留5000个特征提供了使用模型unigram ， bigram 和 1 skip- bigram （ bigram-s ）时获得的 OCA（96.00%）上的F-测量的最佳结果。我们还在表4中提供了在ARMD语料库上使用模型（bigram-s）的结果，这表明该方案略微改善了ARMD的分类结果（83.90%）。对于POS标记的任务，我们使用斯坦福POS标记器。5我们记得在文本评论中使用了三种词性标记：形容词（ADJ），名词（N），动词（V）以及它们的组合。表5描述了在OCA和ARMD数据集上使用所有特征而不减少我们可以看到，使用三个标签的组合：ADJ，N和V实现了最高的F-Measure值（OCA中为91.98%，ARMD中为84.64%）。我们还注意到，使用bigrams模型略有改善分类器的性能在OCA。下一个实验是将POS与特征约简技术相结合。我们继续使用表示POS标记，保留形容词，名词和动词，因为它在我们以前的测试中产生了最好的分类结果。此外，数据集中只保留了最常见的特征。相应的结果如表6所示，它们表明特征约简技术增强了SVM分类器的性能，对于两个数据集，最佳值为5000（OCA中为96%，ARMD中为85.50%）。我们的结论是，POS与特征约简相结合，有助于提高意见分类的结果。本文的实验是关于两种分类器的组合方法的贡献：第一种是SVM，它应用于形容词、名词和动词（POS）的二元组，而不使用特征约简，而第二种分类器则应用于形容词、名词和动词（POS）的二元组。是对评论的情感摘要进行分类的语义方法（lex），相应的结果在表7中示出。我们记得，分类结果的组合是5http://nlp.stanford.edu/software/tagger.shtml网站。表5使用OCA和ARMD上的POS标记的SVM的 FM结果POS型号OCAARMDAdj Unigrams85.6079.94调整N个单位字母90.9884.70调整N双字母组91.3782.31Adj N V Unigram91.8084.64Adj N V Bigrams91.9883.41通过应用前面3.5小节中所示的组合方法中的投票规则来执行。考虑表7，我们观察到用于对电影评论摘要进行分类的词典方法提供了较差的结果，这是出于两个原因的预期行为：首先，分类器输入是在所有评论中不可用（或未检测到）其次，法律方法以其薄弱的性能而闻名。另一方面，语义方法可以捕获评论的极性，特别是对于反映整体意见的结论意见的情况，而在简单特征上训练的机器学习算法不能考虑这样的信息来预测评论的极性出于这个原因，我们提出的方法，结合两个情感分类器显着提高了意见分类结果在两个数据集。在OCA中，性能增益高达3%，在ARMD中高达4%。两个分类器的组合结果证实了它们的互补性。最后，我们将以顾客价值概念来分析及解释使用者的意见。表8示出了两个数据集中关于每个因素及其组合的情感分类结果。为了总结结果，还给出了两个数据集合的平均值。如表8所示，审美方面是情感预测中最具影响力的因素（76.74%），而正常（社会）因素是最不重要的1例（61.00%）。电影作为一种艺术产品，美学因素的主导地位是意料之中的。我们还可以注意到，结合这些因素改善了OCA数据集中的意见分类。电影制作人应考虑这些因素，以改善其产品，并根据客户的需要进行调整5. 结果分析本节讨论从实验中获得的结果。关于情绪预测任务，我们建议B. 卜拉希米等人/Journal of King Saud University1249表6使用词性标注和特征约简技术的SVM FM结果。特征大小数据集10002000300040005000Adj N V Bigrams OCA91.209392.8095.4096Adj N V Bigrams ARMD80.2081.9081.1084.6085.50表7OCA和ARMD联合方法的FM结果方法OCAARMDAdj N V Bigram，SVM91.9883.41审查摘要lex57.7451.28组合95.6087.47表8基于客户价值的FM分类结果。F-measure客户价值OCAARMD平均审美80.0073.4976.74Hedonic64.5261.6063.06实用66.5062.0064.25规范61.6160.4061.00所有值81.0071.8076.40方法证明它们是有竞争力的。事实上，这三种分类方法对实验中使用的两个数据集给出了类似的性能预测对于OCA，通过表3-最好的分类结果分别为96%，96%和95.60%的n-gram，POS和组合的方法。然而，在第二个数据集ARMD中，组合方法给出了最好的结果，达到87.47%，其次是POS（85.50%）和n-gram（83.90%）。考虑到这两个数据集，组合方法略优于其他方法。实验结果证实了组合方法中分类器之间的互补性，以及集成摘要评论在提高情感分类性能中的作用。此外，该组合方法还具有另一个优点，即提取信息的质量，因为我们提出的方法为用户提供了快速访问有意义和丰富的信息，例如评论摘要和客户然而，我们提出的方法不处理意见摘要中的否定问题，如前所述，这个问题是至关重要的，因为否定反转了意见。我们认为，在未来的工作中解决这个问题可以改善意见分类。此外，由于组合方法集成了情感词典，我们认为通过与其他情感词典组合来丰富它将改善混合方法中的意见分类。通过比较评论分类中使用的数据集，对OCA进行的测试表明，预测结果优于我们的AMRD数据集的结果这种性能的优越性可以通过OCA语料库的同质性来解释（Mountassir等人，2013年）。事实上，这个小语料库包括与同一电影标题相关的类似文本评论在这种情况下，OCA中的评论共享非情感特征，例如作者这有助于分类器在OCA中正确预测评论的情感类别第二个因素是，OCA包含精心挑选的文档，这些文档包含与我们的ARMD数据集（包括文档）相反的类似观点对电影的不同方面持相反意见的人。关于数据集大小对意见预测的影响，我们可以得出结论，分类的质量不受数据集大小的我们回顾，OCA中的文档是500篇，而ARMD包括1000篇文本评论，尽管如此，OCA的结果优于ARMD的结果。因此，情感分类基本上取决于评论的质量。最后，为了评估我们提出的方法的性能，我们在这里将我们获得的结果与使用相同数据集OCA的文献中报道的结果进行比较。Rushdi-Saleh等人（2011年）的作者报告F-测量值为90%，而Mountassir等人提出的方法。（2013年）在F测量中记录了高达93%。我们可以说，我们提出的提取相关意见的方法提供了优越的结果（96%的F-测量）。最后，在顾客价值模型的基础上分析了影响用户态度的因素，发现审美价值对用户态度的影响最大根据用户6. 结论和今后的工作这篇文章讨论了用阿拉伯语表达的电影评论的情感分类。本研究的贡献在于提出了相关意见的提取方法，以提高评论分类结果。为了实现这一目标，提出了三种方法，并进行了比较。第一种方法使用包括skipn-gram的n-gram模型，而第二种方法使用词性标注。此外，我们应用了一种特征约简技术，希望通过支持向量机（一种非常知名的阿拉伯语情感分类算法）来改进意见分类。第三种方法是从电影评论中提取评论摘要和观点结论，并使用词法方法对它们进行分类。最后，将所提出的方法相结合，以提高分类性能。为了比较所提出的方法，我们使用了两个数据集：一个是免费提供的OCA，另一个是作者收集的ARMD语料库。实验结果表明，该方法提高了意见分类的效果. OCA的结果优于我们的AMRD数据集的结果。对于OCA，最好的分类结果与n-gram和POS标记方法结合特征约简（96%的F-测量值），而在ARMD，最佳的F-测量值（87.47%）时，POS标记和评论摘要方法集成在分类模型中。关于意见分析的第二个贡献，我们赞成-提出了利用顾客价值模型分析和解释顾客意见的方法。我们发现，审美价值是电影评论领域的第一影响因素。作为未来的工作，我们打算将我们的分类系统应用于其他领域，如社会和政治。此外，我们计划通过丰富情感词典和为不同领域和方面构建特定词典来增强阿拉伯语情感分类。我们还打算调查其他因素，如成本，品牌和形象的意见分类结果的影响。竞争利益作者声明，他们没有已知的竞争性财务利益或个人关系，可能会影响本文报告的工作。1250B. 卜拉希米等人/Journal of King Saud University引用Mountassir，A.，Benbrahim，H.，贝拉达岛2013年。基于阿拉伯语语料库的情感分类。Document numérique 16（1），73-96.Zhuang，L.，Jing，F.，朱湘是的，2006年。电影评论的挖掘和摘要。第15届ACM信息与知识管理国际会议论文集。ACM，pp. 43比50Guthrie，D.，Allison，B.，刘伟，格思里湖Wilks，Y.，2006年。仔细看看skip-gram建模。In：LREC，pp.1222-1225。Al-Smadi，M.，Qawasmeh，O.，Al-Ayyoub，M.，Jararweh，Y.，古普塔湾2018.深度递归神经网络与支持向量机对阿拉伯酒店评论进行基于方面的情感分析。J.计算机Sci. 27，386-393。戴乔治，S.，1990.市场驱动战略，创造价值的过程，10。FreePress，p. 四三二Rushdi-Saleh，M.，Martín-Valdivia，M.T.，Ureña-López，L.A. Perea-Ortega，J.M.，2011. 阿拉伯语意见语料库。J. Assoc. Inf. Sci. Technol.62（10），2045-2054.Pang，B.，李湖，Vaithyanathan，S.，2002年。竖起大拇指使用机器学习技术进行情感分类。ACL-02 Conference onEmpirical Methods in Natural Language Processing（ACL-02自然语言处理经验方法会议）计算语言学协会，pp。79-86.卷 10个。特尼警局 Littman ， M.L. 基于千亿词语

下载后可阅读完整内容，剩余1页未读，立即下载