自学方法克服TripAdvisor评论不兼容性

3 浏览量更新于2023-12-09 收藏 1.52MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

数据科学与管理5（2022）1研究文章一种新的自学方法来克服TripAdvisor评论的不兼容性Prarthana Abeysinghea，*，Thushara BandarabaPeradeniya大学工程学院土木工程系，Peradeniya，20400，斯里兰卡bPeradeniya大学工程学院计算机工程系，Peradeniya，20400，斯里兰卡A R T I C L E I N F O关键词：算法情感分析社交媒体TripAdvisor自学习A B S T R A C T在社交媒体网络中，TripAdvisor扮演着主要角色，因为每个人都渴望分享和评论他们在不同目的地的旅行体验。情绪分析是一种可用于分析人们在公共和社交媒体平台上的行为和意见的方法在这项研究中，酒店评论是从五个最有吸引力的斯里兰卡城市中提取的，用户撰写的评论与用户泡沫评级进行比较，用户泡沫评级将旅行者的整体体验定义为从1到5的数字等级。我们发现，用户撰写的评论和泡沫评级之间的兼容性相关性较低，因为泡沫评级可能不代表用户在评论中表达的真实意见的整体想法。为了解决这个问题，提出了一种两阶段的方法：（1）集成方法，以提高基于词典的输出的性能，并识别正确匹配的用户评论和气泡评级;（2）自学习方法，以发现用户没有正确标记的评论的情感。通过考虑与用户泡沫评级的情感和所提出的模型产生的情感不相容的评论的性能进行了研究。例如，不管二元语法“不好”，从建议的模型和泡沫评级中，每个负面识别的评论的平均百分比“好”分别为25.63%和38.85%。因此，很明显，与所提出的模型相比，泡沫评级所得出的负面情绪具有明显更多的积极词汇。1. 介绍意见和情感是指基于人类所做的一切活动而得出的某些事实或想法情绪主要可以分为三种极性，积极的，消极的，基于对某件事或某个人的看法，情绪或欣赏的中性（刘，2012）。随着Web 2.0和社交网络的快速发展，每个人都适应于表达他们对对象、公司和服务或体验的观点、评论、评级、推荐或想法（Valdivia等人， 2017年）。由于书面审阅的数量庞大，难以确定每份审阅的极性，因此需要耗费更多时间及人力资源。多年来，已经引入了几种方法来自动检测书面评论的潜在情绪，它们往往会增加挖掘意见的过程中的热情，这被定义为意见挖掘或情绪分析（SA）（Saberi和Saad，2017）。SA已被应用于不同的目标，如主观分类，情感分类，意见垃圾邮件检测，隐式语言检测和跨域分类（Ligthart等人， 2021年）。由于其广泛的适用性，它已被用于各种领域，如产品评论，餐馆评论和选举结果预测（Sazzed和Jayarathna，2021）。在SA域中，有三个主要的不同分类级别用于分析：文档级、语句级和方面级。文档级分类将整个文档的意见提取为表达积极或消极的意见或情绪。句子级SA提取文本中每个句子所表达的情感，包括两个主要步骤：第一个是识别句子是主观的还是客观的，第二个是，如果句子是主观的，则对句子表达进行分类，无论意见是积极的还是消极的。文档级和文档级不提取相关文档的所有方面或必要细节，而方面级SA提取文本的特定方面（Medhat等人，2014年）。机器学习、混合和基于词典的方法是解决这些问题的主要方法，对于分析层次，研究人员使用方面、句子和文档级分类。同行评议由Xi交通大学负责* 通讯作者。电子邮件地址：prarthanamabeysinghe@gmail.com（P. Abeysinghe）。https://doi.org/10.1016/j.dsm.2022.02.001接收日期：2021年11月21日;接收日期：2022年2月19日;接受日期：2022年2月19日2022年3月9日网上发售2666-7649/©2022 Xi'an Jiaotong University.出版社：Elsevier B.V.代表科爱通信有限公司公司这是一篇基于CC BY-NC-ND许可证的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。可在ScienceDirect上获得目录列表数据科学与管理杂志主页：www.keaipublishing.com/en/journals/data-science-and-managementP. Abeysinghe，T.Bandara数据科学与管理5（2022）12社交媒体是交互式计算机媒介工具，其允许用户快速且实时地在虚拟社区之间创建或共享内容，诸如信息、想法、职业兴趣和其他形式的表达。Facebook、Twitter和TripAdvisor等网络是全球最受欢迎的平台。在这项研究中，我们专注于TripAdvisor，一个流行的美国旅游平台，引导他们的客户积累旅游信息，以组织他们的假期，旅行和商务会议。该网站显示旅客的经验和意见的旅游相关的位置，如酒店，餐馆，纪念碑，住宿，航空公司，景点，和其他旅游景点的评论。TripAdvisor在游客和管理人员中的受欢迎程度一直在增加，因为该公司提供的服务是完全免费的，易于参与。另一方面，有大量数据可供收集。根据TripAdvisor的统计数据，迄今为止，TripAdvisor上的评论和意见数量约为8.84亿条（Statista，2021）。从2014年到2020年，TripAdvisor上的用户评论和意见数量从2亿迅速增加到8.84亿（Statista，2021）。因此，在每次审查中手动执行阅读，考虑和获得情感的任务并不容易。为了克服从Tri- pAdvisor或任何其他网站提取内容和数据的过程的复杂性，可以使用称为网络爬行或网络抓取的技术（Batrinca和Taviaven，2015）作为一种惯例，TripAdvisor用户写下他们的旅行经历，在TripAdvisor上给他们的旅游地用户可以使用气泡评级对他们的体验进行排名，分数范围从1到5，代表从最差到优秀。 TripAdvisor泡沫评级对于旅行者选择住宿、餐厅或景点至关重要。然而，在五个分数中选择一个分数对用户来说并不困难。因此，此气泡评级可能无法得出旅行者在评论部分中评论的确切值例如，尽管特定酒店的服务设施很高，但通往酒店的道路设施或任何其他设施可能很差（Abeysinghe和Walgampaya，2021年）。由于这种复杂性，旅行者倾向于以较低的泡沫率投票另一方面，酒店寻求者和业主通过泡沫评级，并尝试在不征求旅行者意见的情况下做出重要决定。这可能会解释用户想法的错误想法，并直接影响旅游和酒店业。在以前的研究中，分析和比较都是针对使用TripAdvisor气泡评级的问题进行的（Valdivia等人， 2017年）。为了进行调查，在这项研究中，我们更深入地研究了SA领域，以发现从酒店评论中提取的用户意见和泡沫评级之间的不一致之处。我们考虑情感分析方法（SAM）来发现用户书面评论的极性，并检测气泡评级并不匹配意见中的每个句子，并且它并不代表句子的整个想法。为了解决这个问题，我们提出了一个由两个主要阶段组成的模型：第一阶段使用由情感极性和用户泡沫评级组成的集成概念，第二阶段使用自学习方法。其目的是为每个未标记的评论检测更值得信赖和可靠的用户实际极性。因为，在这个模型中，我们使用多个基于词典的方法来减少使用单个方法的输出所发生的错误，并训练一个自学习方法来使用匹配的评论来检测不匹配的因此，我们通过在负面评论中寻找积极的方面来声明我们的模型是适当的。大多数的TripAdvisor分析工作都只考虑用户评论来分类情感极性，但在我们的模型中，我们还利用泡沫评分来分类情感，以克服用户评论和泡沫评分之间的不匹配问题。此外，我们得到了一个三极性模型（正，中性和负），而不是一个两极性模型（正和负），这在其他模型中很少看到未标记的数据。在这项研究中，我们从TripAdvisor上的五个最重要的评论中提取评论。位于斯里兰卡的热门城市我们应用四个SAM来研究气泡评级和用户评论，并找到每个评论的极性。我们在用户评论上使用我们的模型，并找到更正确的输出。最后，我们得出结论，我们提出的模型提供了一个更可靠的输出相比，用户标记的分数（泡沫评级）。本文的其余部分组织如下。第二节介绍了本文的研究背景和相关工作第3节包含对用户气泡评级和评论之间不兼容性的研究第四节介绍了所提出的模型的方法第5节包括结果和讨论。最后，在第6节中，对本文的结论和未来的工作进行了讨论.2. 相关工作情感极性检测意味着将意见分类为情感类别，例如积极、消极或中性，或其他情感类别（愤怒、悲伤、快乐和惊讶）（Turney，2002）。Nasukawa和Yi（2003）引入了术语SA，并说明了一种SA方法，用于从文档中提取与特定主题的积极或消极极性相关的情感，而不是将整个文档分类为积极或消极。用于情感分类或提取的现有方法是机器学习、混合和基于词典的方法。在机器学习方法中，可以使用监督和非监督方法来对情感进行分类（Norambuena等人，2019年）。在监督方法中，算法在标记数据集上学习，而不是在无监督模型上学习，并将未标记的数据提供给算法。近年来，国内外发表了多篇综述性论文，总结了SALiu和Zhang（2012）概述了文本领域常见的不同方法和算法，特别关注挖掘方法。近年来，半监督学习和自监督学习已被用于SA。半监督学习介于监督学习和无监督学习之间，自监督学习是无监督学习的子集（Ligthart et al.，2021年）。由于SA方法的巨大兴趣和适用性，在过去的几年中，提出的SAM的数量迅速增加。Medhat等人（2014）介绍了SAM的发展及其应用。作为主要应用，SA用于确定产品或服务的用户这些评论对于企业根据关于他们的产品或服务的用户评论的分析结果来做出他们的商业决策是有价值的（Medhat等人，2014年）。SA方法已经被用于分析社交媒体用户评论，例如Tri-pAdvisor、Twitter和Facebook的评论。Yueetal.对SA的一系列最新文献进行了综述。（2019）社交媒体数据。该调查从多个角度对SA研究进行了分类和分类，并探讨了可用于SA研究的不同类型的数据和工具，并提出了它们的优势和局限性。此外，他们认为多模式SA为多学科领域的未来研究提供了重要而及时的机会。Zhang等人（2021）发现，基于网上评论，消费者感知价值对重复购买意愿有正面影响。由于社交媒体评论平台用户的信息采纳过程尚不清楚，Jiang et al. （2021）建立了一个模型，以调查信息质量如何影响电子商务平台中个人信息的使用，并探讨了已识别风险对信息质量和信息可靠性的适度影响。Laksono等人（2019）尝试通过抓取TripAdvisor数据对泗水餐厅的客户满意度进行分类，并使用机器学习和基于词典的方法比较准确性。然而，这可以使用其他SA方法来完成，以提高准确性。Saleena（2018）使用标记数据的统计机器学习技术为TwitterSA导出了一个集成分类系统。然而，这项研究只关注积极和消极的情绪，以建立整体分类器。Valdivia et al.（2017）介绍了TripAdvisor泡沫评级和用户评论情绪不一致的问题，并指出用户经常在积极的意见中写负面的句子，反之亦然。他们指出，应找到适当的办法来克服这种不匹配。最近，Valdiviaet al. （2019）引入使用TripAdvisor点评的用户评级与SAM之间的统一指数，以解决Tri-pAdvisor气泡评级与用户点评之间的不一致性。然而，这项研究引入了P. Abeysinghe，T.Bandara数据科学与管理5（2022）13þ--þ-我...极性聚集模型，具有单个SAM，而不使用多个SAM。基于单一词典的输出可能存在一定的局限性，如词典覆盖问题，以及不受上下文影响的逐词评分方法，并且结果可能会根据所选择的阈值和域而变化。因此，需要引入基于多个词典的方法来克服这些限制，因为它减少了在单个输出方法中发生的错误。3. 用户泡沫评分与评论的不相容性研究在SA，TripAdvisor数据在研究人员中最受欢迎，用于信息提取和预测，但对用户评论和泡沫评级的贡献较小。尽管大多数研究人员只对用户报告的泡沫评级进行注释，但它存在一些不一致之处。在这项研究中，为了进一步澄清这一点，我们专注于泡沫评级和用户评论分类到情感极性的评论作为第一步，图。 1表示检查我们的数据集是否显示TripAdvisor平台上的用户评论和气泡评级之间的不匹配的管道。开发了一种自动网络抓取技术来从TripAdvisor执行数据提取借助由Python及TripAdvisor平台实现的网络爬虫，我们提取了斯里兰卡五个最受欢迎城市（即科伦坡、努沃拉埃利耶、康提、阿努拉德普勒及加勒）的酒店评论，以及二零零五年至二零二零年的相应泡沫评级由于这五个城市有许多令人惊叹的目的地，如斯里兰卡的首都，茶园，植物园，历史遗址和冲浪区，所有国际和当地游客都喜欢参观并入住这些城市的酒店。因此，选择这五个城市的目的是让所有不同的旅行者做出更多的贡献，因为它增强了模型的性能。收集的数据集包括114，566个不同语言的用户书面评论，但我们只考虑英语评论，因为一些基于词典的方法，如VADER词典只考虑英语单词。然而，绝大多数旅客的评论完全或大部分是用英语写的，其他外语评论的影响对整体结果的影响可以忽略不计表1总结了每个城市收集的五个数据集。图 2代表完整用户评论的示例，包括气泡评级和来自TripAdvisor的书面评论：从上到下。绿色气泡表示气泡评级，然后是评论的标题，最后是用户评论。在这项研究中，为了检查气泡评级和用户评论之间的不匹配，我们根据两种方法对数据集进行标记：第一种是使用气泡评级进行标记，第二种是使用SAM进行标记为了使用气泡评级来标记用户评论，我们认为1和2个气泡为负面，3个气泡为中性，4和5个气泡为正面（Valdivia等人，2017年）。对于第二种标记方法，为了确定给定的用户评论是正面的、负面的还是中性的，采用SA方法，该方法可以分为基于机器学习的方法、基于规则的方法和混合方法Fig. 1. 检查用户评论和气泡评级之间不匹配的管道。基于机器学习的方法：该方法由具有分类算法的统计模型组成，可以分为两类：监督和非监督。近年来，研究人员一直在使用半监督和自监督学习方法。监督学习是一种机器学习方法，用于预测未知数据的结果，并从标记的训练数据中学习映射函数。无监督学习是一种机器学习方法，它在不参考标记数据的情况下识别包含数据点的数据集中的模式。半监督学习是一种机器学习方法，在训练过程中需要少量的标记数据与大量的未标记数据相结合。这种方法介于监督学习和无监督学习之间。自监督学习是一种能够利用未标记数据学习模式的方法，是无监督学习的一个子集基于词典的方法：在这种方法中，为每个单词分配积极或消极的情感值要做到这一点，它需要一本积极和消极词汇的字典通常，最流行的英语词汇数据库WordNet（Miller，1995）被用来对词的极性进行混合方法：在最近的研究工作中，研究人员一直在使用不同的混合方法其中包括使用基于词典的知识开发机器学习方法，以及使用LSTM和CNN算法开发集成模型。使用这种方法的目的是克服这两种方法的缺陷和局限性在这项工作中，我们应用基于词汇的方法，即VADER，TextBlob，A finn和Stanza来标记未注释的用户评论（Chauhan等人， 2018年）。用于情感推理的效价感知词典（VADER）是用于文本SA的模型，其对情感的极性（积极或消极）和强度（强度：情感的积极或消极程度）都敏感（Hutto和Gilbert，2014）。VADER SA专门用于发现社交媒体中的情感表达它是一种基于词典和规则的SA工具，可在自然语言工具包（NLTK）中使用，可直接应用于未标记的文本数据（Bonta和Janardhan，2019）。极性输出得分在1和1之间，其中1表示最消极的意见，1表示最积极的意见。TextBlob是一个SAM，用于查找给定句子的极性由于它是一种基于词汇的方法，因此情感由其语义方向和句子中每个单词的强度来定义这种方法需要一个预先定义的字典来分类消极和积极的词。TextBlob在NLTK包中可用，它允许用户对意见进行分类和分类，并支持对文本数据进行复杂的分析和操作（Loria，2018）。极性输出分数介于1和1之间。Finnn是Nielsen（2011）开发的最简单也是最流行的基于词典的SAM。它包含3，300个单词，每个单词都有一个相关的极性分数，这个库包有不同的语言版本极性输出得分位于表1收集的五个数据集的摘要市审查总数英语评论科伦坡57,32651,036努瓦拉埃利耶16,13512,645康提24,89222,514Anuradhapura7,9916,727加勒8,2226,315P. Abeysinghe，T.Bandara数据科学与管理5（2022）14-我...图二. 这是一条在TripAdvisor上的评论。在5和5之间，其中5代表更消极，5代表更积极。Stanza是一种开源的Python语言，支持66种人类语言。Stanza包含一个广泛使用的Java Stanford CoreNLP软件的原生Python接口它的功能涵盖了其他共指消解和关系提取功能（Qi等人， 2020年）。极性输出分数为0、1和2，其中0表示负，1表示中性，2表示正。图3. 五个城市的用户评级（气泡评级）和VADER，TextBlob，Stanza和A finnn情绪的极性分布百分比。P. Abeysinghe，T.Bandara数据科学与管理5（2022）15根据VADER、TextBlob、A finnn和Stanza分数，我们将极性分为正、负和中性。在这种情况下，我们将每个SAM分数缩放到[0，1]并应用阈值范围，其为[0，0.4]为负，（0.4，0.6）为中性，以及[0.6，1]为正（Valdivia等人， 2019年）。图 3代表五个城市的用户评级（气泡评级）的极性分布百分比以及VADER、TextBlob、Stanza和A finnn的极性分布百分比。我们观察到，大多数TripAdvisor用户对他们访问的酒店感到满意，因为对于大多数评论，气泡评级和SAM的极性都是积极的（超过75%的用户投票为积极的，超过75%的SAM检测为积极的，除了Stanza）。Stanza比其他SAM检测到更多中立评论;然而，在阿努拉德普勒和科伦坡城市，Textblob没有识别出任何中立情绪。在同一城市内，各SAM的极性分布略有差异，但各城市的极性分布相似当观察SAM和用户泡沫评级之间的极性分布时，我们发现SAM和用户泡沫评级之间存在轻微的相似性。他们例如，Kandy的每个SAM的平均积极结果约为76%，这与用户标记的积极情绪有近4%的差距。因此，它清楚地表明了一些用户评级和SAM的极性之间的不匹配。详细分析，图。 4表示20个图表，以说明每个城市的每个SAM的负极性在用户泡沫评级上的分布。尽管SAM情绪是负面的，一些评论仍然属于3，4和5泡沫评级。气泡评级的错误分类实现了用户评级和SAM极性之间的不匹配。因此，我们不能推荐将气泡评级作为确定极性的一种措施，因为它不代表用户的总体意见。另一方面，如图所示。 3、不同的基于词典的方法将不同的情感解释为输出。例如，对于 KANDY ，分别从 VADAR 、TEXTBLOB、STANZA和A FINNN中检测到大约92%、76%、50%和87%的积极情绪，这是基于词典的方法的完全不同的输出。见图4。SAM的负极性在用户气泡评级上的分布。P. Abeysinghe，T.Bandara数据科学与管理5（2022）164. 方法在本节中，我们提出了一个新的解决方案，解决用户泡沫评级和书面评论之间的不兼容问题。我们提出的方法包括两个主要阶段（图5），并显示了给定数量的SAM极性（使用SAM分数提取的极性）的步骤。第一种是集成方法，第二种是自学习方法。在第一阶段，我们采用每个SAM极性的输出，以减少一个基于词典的输出与另一个基于词典的输出的错误，因为一些基于词典的方法不能很好地适应某些领域（He和Zhou，2011）。此外，我们考虑了一定比例的极性来自气泡评级，因为气泡评级和SAM极性在某些情况下是考虑到每个SAM极性和气泡评级极性（使用气泡评级提取的极性）的输出，我们将数据集分为两部分：高预测（伪标记）集和低预测集。因此，使用高预测数据集检查低预测数据集的类似评论以获得总体输出。4.1. 第1阶段：总体模型第一阶段包括两个算法：第一个用于计算每个评论的每个极性的概率，第二个用于识别每个评论的情绪。算法1将气泡等级和SAM极性作为输入（在算法中，它显示为method_polarity）。首先，它使用每个SAM极性和气泡评级极性确定每次审查的正、负和中性计数然后，它分别计算每个评论的正、负和中性极性的概率，并将其传递给算法2。它得出每个评论的最终情绪极性算法2的开发，以适应偶数和奇数的情况下，根据所选择的基于词典的方法的数量。如果特定评论的肯定概率是1（即，所有SAM和泡沫评级都具有正面情绪），则该评论的情绪被认为是正面情绪。如果用户评论具有等于1的负概率（即，所有SAM和泡沫评级都具有负面情绪），则该评论的情绪被认为是负面情绪。类似地，如果中性概率是1（即，所有SAM和泡沫评级都具有中性情绪），则该评论的情绪被认为是中性情绪。最后，其余评论被分类为未检测到的评论（即，SAM或泡沫率中的至少一个具有相反的4.2. 第二阶段：自学方法我们的集成方法将审查数据识别为两个主要类别：高预测性和低预测性数据。表示积极、消极和中性的情感输出是高预测数据，其余的“未检测到”数据被认为是低预测数据。在我们的自学习方法中，这些高预测类别和低预测类别被分为两个独立的数据集，P. Abeysinghe，T.Bandara数据科学与管理5（2022）17LJ半]LJ半]FG.-;.;i1N我我我半]半]I jHi半]Hi1N1N图五、拟议的两阶段办法。然后在高预测数据集中的评论中发现低预测评论大多数现有的文本数据问题都考虑使用词频技术来比较一对评论之间的相似性（Saleena，2018），但我们使用归一化的SAM分数，因为它减少了时间和模型的复杂性。比较欧几里德距离以测量相似性，并且如下使用归一化气泡分数（1）和SAM '（2）以实现更好的性能（Khan和Jiang，2014）。审查编号：USE Rε½0;1]。也不是SAMK 是第j个RE的第k个归一化低预测SAM评分。view norSAMε0; 1.nor_USER是第j个评论的归一化低预测用户气泡分数nor_USERε 0; 1。每个低预测审查的欧几里得距离为使用高预测数据集中的评论计算（3）。因此，采用最小距离及其对应的高预测性审查，其被认为是与低预测性审查最相似的审查;其中minEH1Lj;EH2Lj;EH3Lj;：：EHiLj是第j个低预测性审查的最小欧几里得距离5. 结果和讨论在本节中，所提出的方法的性能以两种方式呈现：（1）评论内和（2）考虑到所提出的模型和泡沫评级的负面评论的最常见单词由于我们有几个数据和类似的极性分布的泡沫评级和SAM为每个城市，康提数据集被选择来继续我们提出的模型。在第1阶段，检测到10，575个高预测数据和11，939个低预测数据（表2）在第二阶段，低预测数据的最终情绪然后通过自学习模型分类为积极，消极和中性，表3总结了康提的最终预测情绪5.1. 在审查范围所提出的模型的性能内康提评论。表4显示了TripAdvisor SA处理的五个不同问题以及我们模型的解决方案表4的第一个示例显示了一个评论，其中用户报告其情绪为中性（状态为泡沫率3），并且对于% sUSER % min%sUSER %sUSER也不是用户1N（一）TextBlob;然而，Stanza和A finnn将其检测为负面评论，但VADER检测为阳性。因此，我们得出结论，i最大值为sUSER;也不是SAMK1N1N是山姆·K·敏。sSAMk;（二）方法的输出在某些领域有一些差异，第一次审查是一个很好的例子，为波动SAM的输出。在第一阶段，它最大电流s SAMk;.; s SAM k- min.sSAMk;其中：最初检测为第二个示例检测为阴性也不是用户是第i条评论四个基于词汇的方法，没有任何的错误。与第一个例子相比根据我们的模型，也不是USERε0; 1.也不是SAMK是第i次审查的第k个标准化SAM分数或SAMε0; 1.sUSER是第i个评论的气泡得分。sSAMk是第i次审查的第k个 SAM分数检测消极情绪。即使用户评价它为积极的，这对应于TripAdvisor中的4个气泡，我们可以清楚地观察到它有更多的负面句子。第三个评论进行了一个例子，其中用户泡沫评级，SAM的输出和实际评论情绪之间没有匹配。即使用户声明评论作为一个积极的情绪，VADER检测它是消极的，但其余的ErX。ﬃﬃﬃnﬃﬃﬃoﬃﬃrﬃﬃSﬃ ﬃAﬃMﬃﬃﬃkﬃﬃﬃﬃ—ﬃﬃﬃﬃﬃﬃnﬃﬃoﬃﬃﬃrﬃ ﬃSﬃAﬃﬃMﬃﬃﬃkﬃ ﬃΣﬃ ﬃ2ﬃﬃﬃþﬃﬃﬃﬃﬃﬃ.ﬃﬃﬃnﬃﬃﬃoﬃﬃrﬃﬃUﬃﬃSﬃﬃEﬃﬃRﬃﬃﬃﬃ-ﬃﬃﬃﬃﬃﬃnﬃﬃoﬃﬃﬃrﬃﬃUﬃﬃSﬃﬃEﬃﬃRﬃﬃΣﬃﬃﬃ2ﬃ（三）基于词典的方法将其指示为中性情况。在本例中，HiL j其中：k½ 1HiLjHiLj该模型的情感是中性的;此外，我们观察到它既有积极的句子，也有消极的句子，因此可以说它是一个中性的重新，EHL是第i个高预测审查和第j个低预测审查的欧几里得距离也不是SAMK 是第i次审查的第k次归一化高预测SAM评分，也不是SAMε0; 1。norUSER是第i个用户的归一化高预测用户气泡得分，表2康提的高和低预测评论数量总结（第1阶段）。初始情绪高预测数据低预测数据风景在第四个例子中，用户泡沫评级和三个SAM具有相似的情绪（积极），但Stanza发现它是中性的。然而，根据所提出的模型，该评论的情感检测为积极的，并且它清楚地由文本定义，因为它包含更多的积极句子。此外，在最后一个例子中，三个SAM检测到情绪是积极的，除了Stanza。尽管大多数SAM给出了相同的极性，但它导致我们做出错误的预测，因为它具有更多的消极性。表3对康提的最终情感总结（第2阶段）。积极10,441-最后的感情评价数百分比（%）中性51-积极15,38568.34负83-中性5,83025.90未检测-11,939负1,2995.77P. Abeysinghe，T.Bandara数据科学与管理5（2022）18表4使用Kandy数据集中的五个示例来表现我们的模型审查用户评级维德TextBlobStanza阿芬该模型我们的房间是朝后的，看不到风景。我们要求搬迁，但被告知这是不可能的，3积极中性负负负酒店没有客满……更糟糕的是，在卧室里有一个隔壁的门。酒店房间--虽然锁着，但我们能听到隔壁的噪音，里面的人说话，咳嗽，打鼾--非常令人不安！饭菜一般，不好的是吸烟区就在用餐区旁边。楼上的屋顶酒吧风景很好，缺点是它也是一个吸烟区，当有很多吸烟者的时候，它被覆盖了，这很糟糕明确地不是4星。食物太令人失望了，在所有关于这家酒店食物的好评之后，非常兴奋，我只能说他们一定是解雇了他们的厨师！！食物很糟糕，我可以列出我们在那里吃的几顿饭的错误，因为他们甚至把基本的东西都弄错了（不新鲜）。负负负负负早餐吃烤面包，非常油腻的煎蛋卷配上冷的楔形和一片橘子.....如果没有风景，这家酒店就不会有什么房间很好，有5层楼，所以房间很高。但是很贵，而且还要加收10%的服务费和4%的负中性中性中性中性19%的政府税。一张婴儿床也要30美元。自助早餐还可以，但莫名其妙的是没有靠近或面对河流的桌子。虽然他们正在河边建另一家餐厅，但我对餐厅和前台要求我在退房前付款感到失望这可能是我们在斯里兰卡旅行期间住过的最好的酒店只住了一个晚上，5个晚上真的很遗憾，因为两三个晚上都很值得。登记入住很棒，房间升级非常感谢！房间很棒，可以看到美丽的湖景。梦幻般的屋顶酒吧积极积极中性积极积极服务周到，食物美味游泳池看起来很棒，但时间不允许游泳。绝对推荐这家酒店。我们在这家酒店住了一晚，半小时内又退房了。这家酒店完全被歪曲了。积极积极负积极负在网站上房间非常非常旧，维护得很差，也不干净。墙壁、家具内饰和床上用品上有污渍房间有股霉味。经理对酒店的基本清洁和维护我只对满座感兴趣向经理抱怨说他们引用了...“习惯于清洁他们”，他们“尽最大努力”。我们要求退款，以便找到更好的住宿，但被拒绝了。联系了booking.com，我们是通过他们预订的;非常好。很乐于助人，建议我们退房，并保证我们会得到退款。不推荐这家酒店。图第六章负面评价中最常见的词的频率：建议模型与泡沫评级。但是我们的模型有能力准确地检测到它，这与用户的确切意见是一致的。根据所有最终的情感，我们可以清楚地得出结论，与所使用的基于词典的基准算法相比，我们提出的模型提供了更值得信赖和可靠的情感。5.2. 使用最频繁的单词验证所提出的模型图图6显示了负面评论的词频图，并考虑了基于用户气泡评级和所提出的模型从负面情绪中提取的最频繁的60个词。红色和蓝色分别表示基于气泡评级和所提出的模型的每个词的词频。根据图 6、气泡评级图不P. Abeysinghe，T.Bandara数据科学与管理5（2022）19表5我们的模型性能的例子与方面“好”。用户评论模型很明显，这篇评论的观点是否定性的，除了一句话。第三个例子也与第二个例子相同，但用户评级将其识别为中性;然而，它应该属于负面情绪。因此，我们的模型清楚地检测到更准确和更可靠的，选择了一个短暂的假期却得不到想要的...房间闻起来很糟糕，尤其是床单。浴室也很难闻客房服务不像预期的那样有帮助。食物对当地人来说也不好，品种较少风景也不好，住在一个豪华的房间，可以看到山景，但不是很好。在这家酒店住了两晚。到达时，我们被告知我们没有预订......他们最终发现我们有预订，但在一个小时后，他们坚持我们没有预订！没有收到任何道歉，但后来有水果送到我们房间，但第二天又不见了。我们的司机第二天告诉我们，接待处的一个女人对我们很粗鲁，代表我们抱怨。他们显然对一大群中国游客更感兴趣。房间很大很舒适，但是我们凌晨4点就被清真寺的噪音吵醒了。两个早上我们房间外面的走廊上都有很多死黄蜂。自助早餐和晚餐都很好。地面看起来有点破旧，游泳池太冷了，不能使用。酒店的位置很好。房间很小，浴室有一股难闻的气味。他们答应我会在我的房间里准备一个惊喜蛋糕，但什么都没有。避免在自助餐厅用餐。价格绝对是荒谬的。酒店不提供任何短途旅行。他们有一个家伙坐在那里谁是一个手掌读者，并会告诉你你的未来哈哈。他只是粘在你身边，跟着你，非常令人毛骨悚然的家伙。我不会再来这家酒店了。总经理Hafsa，我在到达之前给他发了邮件，但他没有出现。一次又一次的虚假承诺。这个度假村的食物很荒谬。服务员的服务很差。三星只是为了看风景。负（用户率：2）正面（用户率：4）中立（用户率：3）负负负对每一个评论都有很好的感悟。由于该模型给出了更准确的输出，酒店业主或管理者可以通过感知实际情绪来采取合理的行动，从而改善酒店的不良服务例如，一些用户在对特定酒店写差评时会给出4或5的泡沫评级。在这种情况下，如果管理者仅根据特定的泡沫评级采取行动，他们可能倾向于得出结论，认为他们的酒店提供的服务质量处于高水平。因此，他们避免或不知道他们的不良服务，采取必要的行动，以提高这些不良水平。因此，必须根据拟议的模式作出决定此外，该方法甚至可以用于对与纪念碑、航空公司和餐馆相关的情感进行分类。6. 结论和今后的工作无论何时旅行者提交书面点评，他们也可以根据自己的整体体验来评价住宿、餐厅或景点。TripAdvisor气泡评级是用户在旅行中的整体体验的数字总结。当潜在客户在TripAdvisor上搜索和预订时，他们可以快速浏览用户反馈。然而，如图所示，在图3和图4中，我们可以清楚地观察到，对于流行的酒店评论，用户评级和SA方法的评估之间存在一些不兼容性。这个泡沫评级代表了整个用户对酒店、餐馆或景点的评价，但旅行者通常会写负面的句子，尽管已经报告了4或5个泡沫。这意味着泡沫评级可能并不代表所有书面句子的总体意见。虽然用户总体上有积极的体验，但他们可能对旅行有一些不一致的意见因此，我们可以得出结论，用户可能会在正面评论中写负面句子，反之亦然。因此，气泡评分并不代表用户撰写评论的总体想法，也不是一个很好的指标，可以根据旅行者的意见做出更好的决策。在这项研究中，为了解决这个问题，提出了一个模型来分析用户再-有一个连续的图表，因为在60个最重要的单词在泡沫评级得出的负面情绪中，经常出现的词语缺失在这个图中，我们可以清楚地说，从泡沫评级中得出的每个词的频率都大于从建议的模型中得出的频率。因为更多的负面评论被错误地从泡沫评级中分类出来，而不是拟议的模型。为了进一步澄清，根据泡沫评级，报告了8.039%的负面评论（图1）。3），并且所提出的模型检测到5.769%的负面评论（表3）。但是图 6在气泡评级图上的“好”字上显示出相当大的峰值。气泡评级和建议模型的单词“好”的频率分别为721和364。然而，“好”这个词在这里，考虑了两种方法的二元语法，并且确定了一些用户在发布他们的意见时使用了例如，表5中的第一个评论指出“不好”二元语法，因此它给出了否定的含义。然后计算来自所提出的模型和气泡评级的每个负面评论的单词“好”的平均百分比，而不考虑二元组“不好”，分别为25.63%和38.85%。此外，在泡沫评级的负面分类审查中，可以看到比建议模型更多的方面“井”。因此，泡沫评级得出的负面情绪有相当多的积极的话相比，所提出的模型。此外，很少有其他的例子被认为是测试我们的模型的性能与方面“好”。在第二个例子中，用户评级将评论检测为积极情绪，而我们提出的模型将其检测为消极情绪。由于一些泡沫评分与他们的评论并不匹配，但其中一些对用户意见有一定的积极影响该模型在评论和最常见的负面评论中得到验证。例如，从所提出的模型和泡沫评级（不考虑二元组“不好”）中，每个负面评论的平均百分比分别为25.63%和38.85%。因此，我们提出的模型给出了解决方案的泡沫评级和用户评论不兼容的问题。此外，该方法还可用于标注未标注的文本数据。在决定酒店质量时只考虑泡沫评级会在酒店业造成误解然而，即使是一个接一个地查看用户评论也不是一个可行的任务。因此，有必要根据所提出的模型进行决策，以准确了解酒店。此外，该模型甚至可以用于对与纪念碑、航空公司和餐馆相关的情感进行分类。然而，本研究也存在一定的局限性，如只关注英语语言评论，因此一般性可能有限。在未来的工作中，我们可以提高每个SAM的阈值的边缘，用于将情感得分分为消极，积极和中性，以获得更可靠的情感。此外，机器学习和基于词典的方法的组合可以用于增强模型的性能此外，我们可以计算每个SAM和泡沫评级的准确性，以实现更准确的整体情绪，如果我们可以注释一定比例的数据，即使它是昂贵的。TripAdvisor上的E-X-benchmark数据集没有被标记，因为大多数研究人员使用气泡评级来标记评论。因此，需要使用用户编写的评论来获得注释良好的数据集，P. Abeysinghe，T.Bandara数据科学与管理5（2022）110¼ ¼ ¼¼¼¼这是未来研究的关键竞合利益作者声明不存在利益冲突引用Abeysinghe，H.P.P.M.，Walgampaya，C.K.，2021.用户评论中的情感分析：斯里兰卡阿努拉德普勒市酒店评论中的不相容性研究。23.第二十三章巴特林卡湾，P.C.特拉芬，2015.社交媒体分析：技术、工具和平台的调查。AI Soc. 30（1），89- 116。Bonta，V.，Janardhan，N.K.N.，2019.基于词汇的情感分析方法的综合研究。亚洲JComput.Sci. Technol. 8（S2），1- 6。Chauhan，V.K.，Bansal，A.，地方检察官戈埃尔2018年使用

下载后可阅读完整内容，剩余1页未读，立即下载