阿拉伯方言情感分析的机器学习研究：SLR综述和挑战

176 浏览量更新于2024-01-16 收藏 2.98MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

制作和主办：Elsevier沙特国王大学学报阿拉伯语方言情感分析YassirMatrane，Faouzia Benabbou，Nawal Sael卡萨布兰卡哈桑二世大学，本·姆西克科学院阿提奇莱因福奥文章历史记录：收到2022年2023年4月14日修订2023年4月22日接受在线预订2023年关键词：辩证阿拉伯语情感分析系统性文献综述机器学习预处理A B S T R A C T情感分析是使用自然语言处理、计算语言学和其他文本分析技术来识别和提取主观信息以生成关于文本背后的态度或情感状态的判断的过程。它已被应用于许多领域，包括市场营销，政治和心理学。本文提出了一个系统的文献综述（SLR）的情感分析的辩证阿拉伯语（DA）。这些方言之间的差异主要是基于语法，词汇和句法的差异，这使得研究人员很难对DA进行极性分类。这就是我们的SLR的用武之地，评估DA情感分析的多个方面，并为相关研究的研究人员的工作铺平道路。我们已经确定了对应用于方言情感分析的机器学习模型具有关键影响的所有步骤，包括文本注释，文本预处理，特征提取以及所采用的方法。我们还确定了阿拉伯方言情感分析（SAAD）的挑战和开放问题，研究工作应该集中在那里。版权所有2023作者。由爱思唯尔公司出版代表沙特国王大学这是一个开放的访问CC BY-NC-ND许可证下的文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。内容1.介绍22.系统评价方法32.1.研究问题42.2.搜索策略42.3.入选和排除标准42.4.数据分析师43.相关工作。.............................................................................................................................................................................................................................................................64.审查分析84.1.数据集来源、大小和方言区域（RQ1）84.1.1.数据集区域84.1.2.数据集来源84.1.3.数据集大小94.2.阿拉伯语方言预处理（RQ2）104.2.1.清洁104.2.2.停用词104.2.3.标准化104.2.4.Stemming 114.2.5.音译和翻译11*通讯作者。电子邮件地址：yasser. etu.univh2c.ma（Y。Matrane），faouzia. univh2c.ma（F. Benabbou），nawal. univh2c.ma（N. Sael）。沙特国王大学负责同行审查由Elsevier制作和主持https://doi.org/10.1016/j.jksuci.2023.1015701319-1578/©2023作者。由爱思唯尔公司出版代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页：www.sciencedirect.comY. Matrane，F. Benabbou和N. 立体角沙特国王大学学报24.2.6.否定检测124.2.7.注释方法124.3.SAAD（RQ3）12中的特征提取器4.4.SAAD中使用的方法（RQ4）144.5.性能研究（RQ5）164.5.1.数据集标准164.5.2.情感极性标准164.5.3.预处理技术标准174.5.4.情绪分析方法标准205.讨论和今后的研究途径256.结论26竞争利益声明参考文献261. 介绍自然语言处理（NLP）在各个领域都有着巨大的影响，包括社交媒体、客户服务和反恐，尤其是情感分析（SA）。后者是确定一段文字或语音是否表达了多种语言的积极，消极或中性情绪的过程即使阿拉伯语是阿拉伯国家的主要语言正如Abuata和Al-Omari（2015年）所述，阿拉伯世界古兰经（伊斯兰教的圣书）或古典阿拉伯语可以追溯到中世纪的空气，它是基于我们的先知（愿他安息）时代的几个阿拉伯部落的人所说的旧阿拉伯语脚本的词汇。正如在（洞克莱夫。，现代标准阿拉伯语（MSA），也被称为现代文学阿拉伯语，是古典阿拉伯语（CA）的现代后裔。它的基本语法没有改变，但它的词汇和措辞经历了重大变化，并由于科学和文学的进步而不断变化。根据（Khrisat和Alharthy，2015）和（Habash等人，2013年），方言阿拉伯语来自CA，MSA和外国语言，如法语，英语和西班牙语。为了说明法国占领对摩洛哥当地方言的影响，我们考虑了一个词“警察”的例子，它是法语词“警察”的改编。对于摩洛哥方言，一项研究（Ridouane等人，2016）声称，摩洛哥方言（MD）中只有不到1%的术语来自西班牙语和塔马塞特语，而77.63%和11.72%分别来自MSA和法语。因此，某些DA似乎比任何其他DA更接近MSA，例如巴勒斯坦方言，其被认为是最接近MSA的，如（Kwik等人， 2018年）。另一方面，根据（Abdelali et al.，2020年），不同的阿拉伯方言在不同的国家，尽管阿拉伯语是中东和北非地区的大部分共同语言。这些阿拉伯方言没有统一的书面格式，它们的形式因阿拉伯国家而异，这使得它们难以自动处理（Mallek等人，2017年）（Khrisat和Alharthy，2015年）。阿拉伯世界的阿拉伯方言的变化主要是基于语法和词汇的微小差异，导致一些不同的发音和写作风格（Harrat等人，2015年）。然而，一项由Alsudais等人，2022）表明，不同国家的一些城市可能比同一国家的城市共享更多的特征。然而，根据（穆巴拉克和达尔维什，2014），阿拉伯语方言可以分为六个区域方言，即：马格里布，埃及，海湾，伊拉克，黎凡特和也门。一般来说，每个地区根据作者（Alshutayri和Atwell，2018）的说法，阿拉伯语方言与古典阿拉伯语的关系不如MSA密切。与MSA相比，阿拉伯语和阿拉伯语方言的资源仍然普遍不足有了一些标准的DA资源，如停用词列表，一个大的DA语料库，有一个越来越多的需要开发新的NLP技术，可以应用于不同的Arabic方言，而不受约束。尽管事实上，DA共享了现代阿拉伯语词汇的很大一部分例如，同一个词在不同的方言中可能推断出不同的句法信息。例如，在几个海湾国家，“发短信”这个词的意思是“发送信息或短信”，在黎巴嫩，它的意思是“用白色涂东西”，在摩洛哥，它代表“扇某人的脸”，而在也门，它的意思是“呕吐”。此外，作者在（Almuqren等人，2016）涵盖了变音符号和否定的问题，并强调了它们如何改变单词的含义。例如，在摩洛哥方言中，‘“开关”。此外，根据（Nassr等人，2020），DA有各种各样的脚本（罗马和阿拉伯语），这使得预处理步骤对任何阿拉伯方言的应用至关重要。情感分析过程通过多个步骤来应用，从文本注释、文本预处理、文本提取和分类模型开始。以前的努力集中在调查DA内SA的研究工作。在（Shamsi和Abdallah，2021）中，作者旨在研究用于SAAD的分类方法和方法。相反，作者在（ Boudad 等人， 2018 ）和（Dashtipour等人，2016），集中在SAAD的局限性. 据透露，尽管事实上，大多数研究宣布，他们的研究结果是有趣的，许多挑战仍然有待解决，其中大多数是继承了阿拉伯语言的性质，正是阿拉伯方言的多样性和形态。而作者在（Obiedat等人，2021）和（Ligthart等人，2021）提到，情感表达可能会因领域而异，这使得模型与领域无关。此外，特征提取可能是具有挑战性的步骤，如（Hussein etal.， 2019年），因为这项任务在很大程度上影响了模型的性能，无论是积极的表1PICO标准。标准范围讲阿拉伯语者所做的人口研究工作针对SAAD的比较每项工作的优缺点成果支持未来研究者对相关研究的进展背景加强在市场营销、搜索引擎优化、训练聊天机器人等Y. Matrane，F. Benabbou和N. 立体角沙特国王大学学报3或者消极地。在（Ghallab等人，2020年），作者专注于预处理技术和语言模型的重要性，以处理DA特征的复杂性，如Ara-表2入选和排除标准。入选标准排除标准bizi。作者（Qazi等人，2017），详细介绍了情感分析技术遇到的挑战;其中，最常见的是垃圾邮件，极性模糊，评论质量，sar-casm等。另一项调查（Al-Ayyoub et al.，2019年），被认为具有多个类别，如强阳性，阳性，中性，阴性和强阴性，作为一个重要的问题，2012年以后发表的文章研究的重点是SAAD阿拉伯语母语者所做的研究用非阿拉伯语，如英语和乌尔都语等介绍研究的重复文章。不回答我们SLR情绪分析研究，不涉及阿拉伯方言导致结果不佳在（Elnagar等人， 2021年），作者努力将有关SAAD任务和资源的最大数量的文章分类。关于每种策略的使用频率，他们使用了定量方法来构建这一背景下的调查。尽管对阿拉伯语方言的研究严重不足，（Oueslati et al.，2020年）已经表明，情感资源质量对性能有很大影响。然而，与后者不同的是，我们涵盖了当前有关SAAD工作流程中涉及的整个管道的文献，提供了对每个审查研究进行的所有实验的性能分析这一文献分析旨在提供一个关键的研究方法和建议的各种预处理技术，基于词典和机器学习方法在当前的研究。本文件的提醒部分安排如下。第2节提供了系统性综述方法。第三节介绍相关工作。然后，在第4节中，我们详细阐述了调查结果。第五节讨论了未来的研究方向最后，本研究在第6节中得出结论。非语义学英语研究论文取向或极性分类。发表的研究论文未知数据库会议或期刊2. 系统评价方法学系统性文献综述是文献综述的一种形式，其中收集并批判性分析特定主题的文献，以识别，选择，综合和评估关系，局限性和重要发现，以总结定量和定性研究。因此，单反相机通过提供某个主题的前沿概述来节省我们计划通过寻找讲阿拉伯语的人撰写的文章来缩小搜索范围，因为他们更有可能拥有进行准确研究所需的知识，这遵循了（Okoli和Schabram ， 2010 ），（ Wright 等人， 2007 年）和（预算和Brereton，2006年）在收集和分析过程中使用严格的研究方法。Fig. 1. 论文的预筛选过程Y. Matrane，F. Benabbou和N. 立体角沙特国王大学学报4图二. 按时间搜索的研究类型。图三. 最流行的数据库中的文章。进行SLR的关键步骤是：研究问题的定义，进行文献检索，质量评估，数据收集，数据提取和结果解释。2.1. 研究问题在确定我们的 SLR 的研究问题之前，我们考虑了根据PICO（Stone，2002）构建的几个标准。因此，我们确定了SLR的研究问题，具体如下：1) 综述研究中使用的数据集的区域、来源和大小是什么？2) SAAD中使用了哪些类型的预处理技术3) SAAD中使用的特征提取技术有哪些4) 用于执行SAAD的情感分析方法有哪些？5) 就精度性能而言，SAAD最有效的技术是什么2.2. 搜索策略我们的搜索策略遵循三个阶段，以确保它们符合表1中提到的选择标准。我们首先检查论文的标题和摘要，以确定该研究是否可能相关。第一阶段是当研究完全符合选择标准时，这导致我们阅读整篇论文。另一方面，第二阶段并不完全符合我们的标准，但它可能包含一些有价值的想法，可以帮助我们在我们的研究。最后，在第三阶段，研究被认为是不相关的。图1描述了我们的检索策略的步骤，其中仅识别出75篇相关论文2.3. 入选和排除标准入选标准是研究入选的所有要求，而排除标准是认为研究不符合入选条件的要素。我们应用了表2中提到的入选和排除标准，以便仅识别可能有助于回答我们研究问题的主要研究。此外，我们还重点研究了以阿拉伯语为母语的人撰写的关于SAAD的英文论文。2.4. 数据分析师这个SLR的搜索过程意味着检索著名的期刊和会议。审查的时间范围为2012年至今发表的论文。根据研究问题，使用以下查询（方言或方言或口语）和（阿拉伯语或阿拉伯语）和预处理和Y. Matrane，F. Benabbou和N. 立体角沙特国王大学学报5表3审查的研究来源。来源出版地点选定的研究杂志文章国际工程管理（Hamouda和Akaichi，2013年）国际自然语言计算杂志（International Journal on Natural Language Computing）Ibrahim等人，2015），（Al-Harbi，2017）计算科学研究（Mataoui等人，（ 2016年）国际高级计算机科学与应用杂志国际计算机科学与信息安全杂志（Alowaidi等人，2017），（Mihi等人，2020），（Alharbi，2021）（Abdouli等人，（2017年）Journal of Theoretical and Applied Information Technology（Rouby et al.，2018年）Journal ofInformation Science（Assiri et al.，2018），（Oussous等人， 2020年）Computacióny Sistemas（Abdellaoui和Zrigui，2018），（Masmoudi等人，2021），（Masmoudi等人， 2021年）IEEEAccess（Alali等人，2019），（Alwehaibi等人，2021），（Abdelminaam等人，2021），（Wazrah和Alhumoud，2021），（Alowisheq等人， 2021），（Alowisheq等人，2021），（Obiedat等人， 2022年）大数据杂志（Baali和Ghneim，2019）SpringerInternational Publishing（Abu Kwaik等人， 2019年度）埃及信息学杂志（Elshakankery和艾哈迈德，2019）信息技术的国际阿拉伯杂志（Al-Harbi，2019）人工智能（InteligenciaArtificial）（Guellil等人，（2020年b）社交网络分析和挖掘（Guellil等人，（2020年a）约旦计算机和信息技术杂志（Nahar等人， 2020年）Journal ofInternet Technology（Kanan等人， 2020年）可持续性（Abo等人， 2021年）Arabian Journal for Scienceand Engineering（Alharbi等人， 2021年）传感器（Aljabri等人， 2021年）SNComputer Science（Guellil等人，2021年a）PeerJ计算机科学（Almuqren和Cristea，2021）国际计算机科学与网络安全杂志（Ayadi等人，2021年）基于知识的系统（Touahri和Mazroui，2021）亚洲和低资源语言信息处理计算机科学杂志信息系统（Nassif等人， 2022年）（Yafooz和Alsaeedi，2021）（Omar等人， 2021年）会议文章阿拉伯语的计算方法，AMTA（Shoukry和Rafea，2012）IADIS欧洲数据挖掘会议（Soliman等人， 2013年度）ASE社会信息学国际会议（El-Makky等人， 2015信息和通信系统国际会议计算语言学国际会议：技术论文（Duwairi，2015），（El Naggar等人，2017），（Alzyout等人，2021）（Dahou等人，（ 2016年）IEEE大数据国际会议（Altowayan和Tao，2016）阿拉伯语自然语言处理研讨会（Baly等人，2017 a），（Medhaffar等人，（2017年）ProcediaComputer Science（Al-Twairesh等人，2017），（Baly等人，2017 b），（Al-Thubaity等人，2018），（Soumeur等人， 2018），（Elnagar等人， 2018），（Moudjari和Akli-Astouati，2020），神经信息处理国际会议（Al-Azani和El-Alfy，2017）系统与软件计算方法会议录高级智能系统与信息学脑启发认知系统国际会议计算与实验科学与工程国际会议（Rahab等人，2018年）（Abdelhade等人，2018）（Guellil等人，（Alnawas和Arici，2018）Computacióny Sistemas（Mulki等人，2018年）计算机、控制、电气和电子工程（Ismail等人，2018），（Abuuznien等人， 2021年）深度学习世界中的自然语言处理（Tobaili et al.， 2019年度）计算机与信息科学国际会议智能系统与高级计算科学知识发现、知识工程与知识管理国际联合会议（Abo等人，2019）（Abdelli等人，2019）（Chader等人， 2019年度）智能城市应用国际会议（Dahbi et al.，2020年）语言资源和评估会议（Adouane等人，2020年）开放源码阿拉伯语语料库和处理工具讲习班主观性、情感和社交媒体分析数字时代技术进步促进可持续发展工程、技术应用科学研究IEEE信息和通信系统（Kwak等人，2020）（Guellil等人，2021b）（Matrane等人，2021）（Yafooz等人，2021）（Duwairi等人， 2014年度）Y. Matrane，F. Benabbou和N. 立体角沙特国王大学学报6（接下页）Y. Matrane，F. Benabbou和N. 立体角沙特国王大学学报7表3（续）来源出版地点选定的研究沙特国王大学学报-计算机与信息科学（Abuata和Al-Omari，2015年）书籍文章SpringerInternational Publishing（Maghfour和Elouardighi，2018），（Jerbi等人，2019），（Elfaik和Nfaoui，2020）模式识别和人工智能（Messaoudi等人， 2020年）时间极性”）。在图2中，最主要的来源是会议文章，占总来源的近80%。然而，评论和期刊文章占18%。相比之下，使用最少的来源是书籍章节，仅占2%。由于检索策略直接影响检索到的研究的相关性和完整性，因此我们设法使用图1所示的最突出的数据库。 3：SciELO、Scopus、IEEE-Xplore、Springer、ScienceDirect、Thesai、BiblioMed、SagePub、PubMed 和 ACL Acanthology 。论文数量最多的是IEEE ，其次是Springer，ScienceDirect和ACL。所选研究及其出版物来源见表3。3. 相关工作提出了不同的方法和工具对MSA进行近年来，越来越多的研究针对不同阿拉伯方言的情感分析。SAAD的各种挑战已经被调查，如形态复杂性，语言依赖，阿拉伯语的音译，停止词去除，词干，和否定检测等。根据文献，我们确定了三种主要的方法：基于词典，机器学习和混合方法。基于词典的方法使用预先准备的情感词典来聚合文档中所有词的情感分数词典的构建有两种方法：基于词典的词典和基于语料库的词典，它们都是领域相关的。少数作品使用了通过使用文体和句法特征以及词性标记（ POS ）获得的词汇特征（ LF ）在这方面，在（Abdul-Mageed et al.，2014），作者提出了一个实证评估的情况下，情绪分析，调查MSA和DA之间的差异。这项工作的目的是减少数据稀疏通过多个形态特征，如词性标注，除了多个标准的功能，包括极性词典，处理主观分类。因此，他们根据主观性将数据集分为MSA和DA不平衡子集，因此准确率分别为65.10%和79.01%。而（Hamouda和Akaichi，2013）使用首字母缩略词，感叹词和表情符号作为词汇特征，以及N-gram和SVM算法达到75.31%的准确率。对阿尔及利亚方言进行了多项实验，其中（Mataoui et al.，2016）使用了7698条评论的数据集以及几种预处理技术，例如音译、翻译和khoja词干提取，以及基于通用短语相似度计算模块的基于词典的方法几乎没有任何工作使用基于本体的词典有效地将来自多个异构源的词汇信息与给定领域本体的实体相关联。在这方面，作者在（Alowaidi等人， 2017）使用WordNet从826条推文的数据集中提取概念特征，并比较了朴素贝叶斯（NB）和SVM等各种分类器。因此，SVM算法使用F1分数度量获得了95.63%的最佳分数。在此背景下，从3484条评论的数据集中提取了几个手工制作的特征（Abdelaliet al.，2020;Abdelhade 等人， 2018;El-Makky 等人， 2014; Habash ，2010;Rouby等人，2018年）。作者使用否定、词性、加强词和表情符号作为LF，以及每个词的语义方向，以计算评论的极性得分。结果表明，它们对阳性标记和阴性标记的准确率分别达到98.2%和93.2%。在（Assiri等人，2018年），作者提出了一项研究，仅使用基于词汇的方法。在应用了几种预处理技术之后，他们最终得到了一个包含14,000个消极或积极情绪术语的大规模词典。本研究的主要贡献是提出了一种新的加权基于词典的算法（WLBA），该算法利用主观词和客观词之间的关联来捕获上下文对极性强度的影响。为了评估他们的算法的性能，他们将其与双极性算法进行了比较，双极性算法基于对正项和负项的频率求和。他们在实验中使用了4700条推文的数据集以及一些预处理技术。然后，基于基于词汇的特征，如否定，恳求和情感词长度，他们达到了85.4%的准确率。在同一背景下，（知识媒体研究所，开放大学，英国等，2019）使用基于词典的方法以及词典的多种扩展技术，因此准确率为69%，与基于词汇的方法不同，在人工标记的文档中，ML方法可以通过在大量数据上训练模型来自动改进的例子。后者已被广泛用于SA的阿拉伯语。构建基于预测的特征提取器的一些工作是 Word2vec （ Le 和 Mikolov ， 2014 ），如在（Altowayan和Tao，2016）和（Baly等人，2017年b），Word2vec给出了最好的结果。在第一个实验中，作者使用了一个包含63，000个评论的突尼斯数据集，这些评论通过逻辑回归（LR）算法进行训练，F1得分为81.88%。而在第二个实验中，当使用LF和SVM对1200条推文的Egyp- tian数据集时，准确率达到60.6%，而使用Word 2 vec作为基于预测的嵌入（PBE ）技术以及 DL 算法时，准确率达到70% 。在（Duwairi等人，2014年）、作者研究了各种预处理技术和机器学习算法在从Twitter获得的Jorda数据集上执行的有效性。在1000条评论的数据集上使用了多种预处理技术，如停用词删除、否定处理、音译、将约旦方言翻译成MSA和表情符号替换。与SVM和KNN算法相比，NB算法的准确率最高，为76.78%。另一方面，在（Alnawas和Arici，2018）中，作者应用了Doc2vec作为PBE技术，在33，000条推文的数据集上，准确率达到93%。作者在（Oussous等人，2020），在没有预处理步骤的情况下使用术语频率和CNN架构对2000个评论的摩洛哥数据集进行了各种实验，从而达到了96%的准确率，因此，在应用预处理步骤后，性能几乎没有提高3%，而在（Soumeur）进行的实验中，例如，2018年），作者在阿尔及利亚的25，475条评论的数据集上应用NB 分类器和 BOW 特征提取器，无需预处理，因此准确率达到60.11%。在-Y. Matrane，F. Benabbou和N. 立体角沙特国王大学学报8因此，在执行预处理步骤之后，已经实现了几乎10%的改进。在（Adouane等人，2020）训练的BiLSTM架构以及fastText单词嵌入，准确率达到66.78%。在（Mihi等人，2020）在MSTD数据集上，使用词频-逆文档频率（TF-IDF）和LR的四向分类准确率达到56.3%，使用词袋技术（BOW）和支持向量分类器（SVC）的四向分类准确率达到55.6%。另一方面，使用线性SVC和TF-IDF与trigram的双向分类（正，负）的最佳准确率达到77.6%。基于频率的特征提取器显示出足够的结果;然而，与统计方法相比，基于预测的嵌入方法完全彻底改变了NLP任务。此外，WE技术通常与深度学习（DL）方法（如递归神经网络）相结合。在这种情况下，作者（Elfaik和Nfaoui，2020）在不同的数据集上进行了几次实验，主要使用Word2vec和几种ML算法，结果在突尼斯方言的数据集上实现了最佳性能，有16，448条评论，SVC算法的准确率为81.46%。同一作者在1951条推文的数据集上进行了几次实验，因此，他们使用随机梯度下降（SGD）实现了79.52%的准确率，而SVM的准确率最高，为81.01%。在这方面，（Antoun等人，2020）开发了AraBERT作为语言模型，为大多数NLP任务提供了尖端的性能。后者被用于实验（Matrane等人，2021），本文作者使用了MSTD数据集。在这项实验中，他们使用双向长短期记忆（BiLSTM）作为最佳结果，能够达到83.24%的双向分类准确率。此外，对于ML算法，支持向量机（SVM）的准确率最高，为80.82%。在这方面，提交人在（Touahri和Mazroui，2021）报告中，从词典特征（LF）和词袋以及SVM得分89.24%实现了最佳准确性，而从Word2vec模型得分80.36%实现了最低准确性。这些实验表明，仍然需要大量的努力来改进语言模型。Mulki等人，2018），其中作者旨在使用不同的数据集评估ML方法相对于基于词典的方法的有效性。他们的结果表明，ML算法优于基于词典的算法，使用NB对第一个数据集的准确率达到75%，而在基于词典的方法中，准确率几乎没有达到67%。对于第二个数据集，提供了相同的结果，SVM算法达到了94%的准确率，而基于词典的方法达到了81.9%。Dahbi等人，2020）旨在评估6750数据集上的几种ML算法，如SVM，K-最近邻（KNN），NB和决策树（DT）。结果表明，SVM算法的准确率达到94%，取得了最好的效果.在这种情况下，SVM在几项工作中证明了其优于多个分类器的性能，其中，（ Al-Twaireshet al.，2017），（Elnagar等人，2018），（Kwik等人，2020），（Alowisheq等人，2021）和（Abuuznien等人，2021）使用TF-IDF作为特征提取器和SVM分类器的组合达到了最佳性能。此外，在Ayadi等人提供的工作中，2021）中，SVM算法的性能最好，准确率达到96.6%。然而，在Abdouli等人， 2017年），NB给出了69%的准确率作为最佳结果。SVM分类器证明了其使用多个特征提取器的有效性，例如TF（Almuqren和Cristea，2021），准确率为91%，以及（Obiedat等人，2022）在约旦的2790 条评论的数据集上使用了BOW，以及基于smote的增强数据技术，从而获得了88%的准确率。此外，（Guellil等人，2018），（Guellil等人，2020 a）和（Guellil etal.，2021）使用word2vec和随机梯度下降（SGD），分别在F1评分中获得90.16%，90.16%和88%而在（Abdelli等人，2019）使用相同的WE以及SVM算法，F1得分达到85%。一些著作对突尼斯方言进行了实验，如（Medhaffar等人，2017），和（Messaoudi et al.，2020年）。后者收集了来自Facebook的9196条评论，这些评论使用mBert和CNN架构进行训练，从而达到93.2% 的准确率。另一方面，一些研究，包括（ Ismail et al. ，2018），采用TF-IDF，KNN算法的准确率达到92%，此外（Abo etal.，2019），调查了SA中的苏丹方言，作者使用DT和基于词典的特征进行了两个实验，双向和三向分类，准确率分别为83.5%和60.85%。在这方面，（Abu Kwaik等人，2019）进行了双向分类，其中CNN-LSTM架构和AraVec作为特征提取器用于2000条推文的数据集，准确率达到93.5%，三向分类的准确率为76.4%，而（Nassif et al.，2022）使用AraBERT和随机森林（RF）算法对91，000条评论进行了五向分类，从而达到了89.7%的准确率。同样，RF在以下文献中证明了其优越性（Kanan et al.，2020年），在F1得分中得分为94.9%。海湾方言被用于多项研究，如（Alzyout et al.， 2021），其中作者使用TF-IDF嵌入数据集，从而通过DT算法实现75.25%的准确性，而在（Aljabri etal.，2021）LR给出了最好的结果相比，其他ML算法，得分89.9%的准确性，另一方面，（Alwehaibi等人，2021年）在15，945个注释上训练CNN-LSTM模型，达到92.26%的准确率。作者在（Abo等人，2021），通过检测包含少于三个字母的单词来处理停止词，并在11，647条评论的数据集上训练MLP分类器，达到85.3%的准确率。深度学习架构已经证明了它们在SA中的效率，如（Abdellaoui和Zrigui，2018）等主要研究所示，其中作者使用LSTM在F1得分中获得了89%，而在（Alharbi，2021）中，作者使用CNN和BiLSTM的组合，在F1得分中获得了89.64%。乘法LSTM（mLSTM）架构由（Al-Azani和El-Alfy，2017）和（Abdelminaam等人，2021）研究，后者在5，615，943条评论的数据集上达到了99.75%的准确率。Dahou等人进行的工作， 2016），和（Alali et al.，2019），通过CNN架构在多方言数据集上训练他们的模型，第一项工作使用Word2vec从5464条评论的数据集中提取单词嵌入，从而达到96.2%的准确率。而在第二项工作中，作者使用了FastText，因此达到了78.7%的准确率。在（Maghfour和Elouardighi，2018）中进行的实验显示，DT算法在双向和三向分类方面的性能分别优于NB，准确率分别为60.85%和83.5%。此外，神经网络通常最适合大型数据集、大量特征和复杂的下游任务。如在由（ Abdelhade 等人， 2018 ），（ Baali 和 Ghneim ， 2019 ）和（Matrane等人，2021），诸如CNN和RNN的DL算法在一定程度上优于ML算法。此外，（Alharbi等人，2021）进行了多个实验，其中LSTM-GRU 给出了最好的性能，在 5288 条评论的数据集上达到94.32%，然而，（Baly et al.，2017a）尽管使用了基于词典的特征和RNN架构，但准确率仅为58.5%。另一方面，Guellil等人，2018），其中作者使用BOW和Doc2vec作为特征提取器，并将其与各种分类器（如Logistic回归（LR），NB，RF，DT和SVM）进行比较。实验结果表明，LR的准确率最高，BOW为78%，Doc 2 vec为59%。在同样的背景下，另一个实验（Shoukry和Rafea，2012）显示了ML方法的优越性。作者应用了几个实验，其中SVM算法与多种预处理技术一起使用，Y. Matrane，F. Benabbou和N. 立体角沙特国王大学学报9结果78.8%的准确度作为最佳实验，另一方面，当使用LB方法时，仅实现75.4%。（Yafooz和Alsaeedi，2021）的作者旨在分析针对糖尿病草药治疗的用户情感取向。本研究对含有1013个阳性和3098个阴性成分的数据集进行了一系列预处理。SMOTE在处理不平衡问题时，使用SVM和LR两种分类器，其准确率最高，在一元组中分别为94.94%和92.58%，在95.27%~ 92.85%之间分别在三个字母在（Omar等人，2021），作者使用了各种基于频率的方法，如BOW，N-gram，TF和TF-IDF，对来自不同网站的3063条评论的数据集中的评论进行分类。该数据集还经过了多种预处理方法，包括归一化、去除变音符号、去除加长和去除重复字符。作者使用了四种ML算法：SVM，NB，SGD和LR。BOW和LR算法的准确率最高，为76.67%。几种ML算法被作者使用（Yafooz等人，2021），分析2732条YouTube评论的数据集的情绪。在这项研究中，他们采用了多种算法，如NB，SVM，KNN，SGD，RF，XgBoost，AdaBoost，DT和LR。SVM算法的准确率最高，为80.12%，而LR算法和N-gram技术在F1评分中的准确率为81%。最近，DL被认为是ML领域中一种很有前途的方法。混合方法结合了ML和基于词典的接近优势。在这方面，Soliman等人， 2013），结合了SVM算法的优点和基于词典的特征，从而在F1得分中达到82.9%，而由（ElNaggar et al.，2017），使用SVM，准确率为90%。此外，这两种方法都有效（ El-Makky 等人， 2015 ）和（ Elshakankery 和Ahmed，2019）在多个数据集上使用混合方法，包括由（Elmadany等人，2018），因此使用SVM算法在整个极性标签中分别获得81%和84%的准确度，使用RNN架构获得73.67%的准确度。在（Al-Harbi，2019）中，作者使用基于词典的特征在约旦的2500条推文数据集上应用ML算法，结果准确率为91.22%此外，Moudjari和Akli-Astouati，2020年的作者对来自Facebook的22，761条评论的阿尔及利亚数据集进行了多次实验，他们使用LF和n-gram来提取相关特征，并使用最大熵（ME）进行分类，从而达到78%的准确率，而CNN架构的准确率达到79%。4. 审查分析本节阐述了我们系统性文献综述的主要发现，这些文献75篇文章被认为是主要的，因为它们包括在Ara进行的几项实验见图4。数据集区域。图五. 数据源图六、使用的数据集的大小bic方言情感分析本研究将通过对整体实验结果进行定量和定性研究来回答本研究开始时提出的第六个研究问题。本研究将涵盖SA模型生命周期的每一步。4.1. 数据集来源、大小和方言区域（RQ1）4.1.1. 数据集区域阿拉伯语方言在一个国家内部和从一个地区到另一个地区都有所不同，这是由于从邻国借来的俚语。因此，研究人员使用的数据集是从不同地区收集的，使我们能够进行深入分析。关于所审查研究中使用的数据集，其中大多数包括以阿拉伯方言编写的内容，以及基于DA和MSA之间联系的MSA。仅在以下作品中提出了具有专门的阿拉伯语方言的数据集，例如马格里布语、埃及语、黎凡特语、苏丹语和海湾语（Guellilet al.，2020 b），（Guellil等人，2018），（Jerbi等人，2019），（Chader等人，2019），（Masmoudi等人，2021），和（Moudjari和Akli-Astouat

下载后可阅读完整内容，剩余1页未读，立即下载