餐厅推荐系统中用户和场所个性与主题建模的结合

16 浏览量更新于2023-09-05 收藏 888KB PDF 举报

推荐系统

主题建模

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

CEUR程序http://ceur-ws.org餐厅推荐系统EvripidesChristodoulou1、AndreasGregoriades1、HerodotosHerodotou1和MariaPampaka21塞浦路斯理工大学，塞浦路斯利马索尔2曼彻斯特大学，英国曼彻斯特摘要推荐系统是一种流行的信息系统，用于支持决策者然而，尽管他们在简单的问题上取得了成功，如音乐推荐，但他们在高度复杂的领域中表现不足，其特征在于许多参数，如餐馆推荐。最近的研究已经认识到个性在影响消费者选择方面的重要性，但是推荐方法在餐馆推荐问题中没有利用这一点。因此，这项工作旨在分析的贡献，结合提取的主题，从消费者的电子口碑（eWOM）的餐厅推荐系统的个性本文采用了一个双向Transformer的方法与前馈分类层的个性预测，由于其在类似的问题比其他机器学习模型的性能提高。这种方法的一个问题是处理长文本，例如由不同个性类型（标签）的人撰写的叙述。因此，对不同的长文本管理方法进行评估，以找到具有最佳个性预测性能的方法。两个人格模型进行评估，即迈尔斯-布里格斯和大五，基于两个标记的数据集，用于生成两个人格分类器。除了客户的个性，这项工作探讨了场地个性的概念，估计从访问了一个场地，喜欢它的用户的个性。最后，客户和场地的个性一起使用的主题讨论的客户形成的输入到极端的梯度提升（XGBoost）模型，用于预测用户评级的餐厅。这些模型的性能相比，传统的协同过滤方法，使用各种预测指标。关键词个性预测，推荐系统，主题建模1. 介绍已经开发了推荐系统，以通过解决信息过载来为消费者的决策过程提供支持在旅游业中，他们的目标是通过更好地满足游客的需求和愿望来提高游客的体验。传统的推荐方法基于从用户的历史记录（诸如评级、评论或购买）提取的用户偏好来进行推荐流行的技术包括协作和RecSys旅游推荐研讨会（RecTour 2022），2022年9月22日，与第16届ACM推荐系统会议在美国ep.xristodoulou@ edu.cut.ac.cy（E. Christodoulou）; andreas. cut.ac.cy（A. Gregoriades）; herodotos. cut.ac.cy（H. Herodotou）;maria.pampaka@ manchester.ac.uk（M. Pampaka）0000-0002-7422-1514（A. Gregoriades）;0000-0002-8717-1691（H. Herodotou）;0000-0001-5481-1560（M.Pampaka）©2022本文版权归作者所有。在知识共享许可署名4.0国际（CC BY 4.0）下允许使用讲习班刊号1613-0073CEUR研讨会论文集（CEUR-WS.org）基于内容的过滤方法。最近，人们对用户个性的利用产生了浓厚的兴趣性格与消费者的情绪直接相关，并对满意度有很大的影响[3]，理论表明具有相似性格特征的人有相似的偏好和需求[3]。用户个性的应用已经增强了旅游领域中推荐器的性能，其中来自调查问卷数据或自动个性识别的结果被发现以改进兴趣点、目的地推荐。同样，场地个性与品牌和满意度直接相关，但尚未在餐厅推荐中进行研究。餐厅有自己的品牌，品牌又有个性，就像人一样，吸引着有着相似个性的人[4]。与餐馆的概念和个性相关的消费者比那些不相关的消费者更有品牌个性源于个性心理学[5]，可以定义为与品牌相关的人类特征考虑到消费者更喜欢与他们自己的个性一致的品牌，可以由访问过场所并喜欢它的消费者来提取场所的个性这是本研究采用的方法尽管用户和品牌个性的重要性，他们还没有被用于餐厅推荐，这使得这项工作的新颖性。所提出的方法利用消费者我们假设，场地个性可以提高推荐，由于用户和场地的个性之间存在的联系网络口碑代表了消费者对产品和服务的意见，并已被广泛用于识别消费者本文评估了两种流行的人格模型，迈尔斯-布里格斯类型指标（MBTI）[6]和大五[7]，结合用户在电子口碑主题中表达的偏好。用户的eWOM主题和个性标签的最佳组合的识别是通过训练和比较两个极端梯度提升（XGBoost）模型来进行的，每个模型都使用以下特征：（1）使用两个候选个性模型（MBTI和BIG5）从eWOM中识别的用户的个性，（2）用户从eWOM主题对场所的感知，以及（3）基于主题的场所的个性。访问该场所并喜欢它的用户的个性。由于XGBoost模型在类似的推荐问题中具有良好的性能，因此为此生成了XGBoost模型在这项工作中解决的研究问题是如何最好地结合用户和场地的个性模型与主题特征推断从eWOM产生最好的推荐，在流行的基于模型的协同过滤（CF）技术。这是我们以前工作的延续[8，9]，研究了推荐系统中个性和情感的使用。这项工作的贡献有三个方面。首先，它确定哪种长文本管理方法产生最佳的个性预测。其次，研究了餐馆推荐中的场所个性概念，并评估了其影响。餐厅的个性是根据访问过场所并喜欢它的用户的个性来估计的。最后，它显示个性和eWOM主题的哪种组合改善了餐馆推荐。本文件的结构如下。下一节介绍餐馆推荐系统的背景知识和从文本中提取个性的技术下一节描述了使用深度神经网络识别消费者eWOM中讨论的主题和个性预测的技术。随后的章节详细阐述了所遵循的方法和所获得的结果。本文最后讨论的结果和未来的方向2. 现有知识本节回顾了推荐技术、个性的概念，并详细说明了迄今为止它是如何在推荐系统中使用的。2.1. 餐厅推荐系统推荐系统旨在预测消费者对他/她尚未购买的物品（产品/服务）的满意度[10]。这是一对一营销的一部分，旨在将商品与消费者的偏好相匹配，而不是旨在满足目标市场细分的大众营销[ 11 ]。流行的方法关注消费者过去的经验（评级），以创建用户-项目矩阵，并基于此预测什么更适合用户，这取决于用户或项目（产品，服务）之间的相似性[ 10 ]。消费者之间或产品之间的关系可以使用相似性度量来发现，这种方法称为协同过滤（CF）[12]。这已成功应用于旅游推荐问题，如酒店或兴趣点，并被认为是最流行的技术之一[13]。另一种流行的技术是基于内容的过滤，它试图根据项目的特征而不是他们的评级来猜测用户可能喜欢什么[ 12 ]。混合方法利用基于内容的过滤和协同过滤的优点[10]。然而，CF技术遭受冷启动问题，该冷启动问题在关于用户的数据非常少或没有数据可用时发生，并且因此不能识别类似的消费者[14]。此外，当用户-项目矩阵中存在大量未评级项目时，数据稀疏会加剧问题当没有足够的数据来填充用户-项目矩阵以进行可靠的推断时，就会发生这种情况[15]。在旅游业中，由于游客在目的地停留的时间有限，收集数据既困难冷启动问题出现在首次用户（游客），因为没有他们在特定目的地的购买活动的记录。为了解决这些CF问题，最近的方法利用机器学习技术，如矩阵分解，使用从初始数据中出现的潜变量来近似用户-项目矩阵内容。奇异值分解（SVD）、优化SVD（SVD++）和非负矩阵分解（NMF）模型对用户项矩阵进行分解，并预测用户对未知产品的满意度[16]。或者，基于内容的方法利用关于新产品的元数据来解决冷启动问题。获取这些元数据的有用来源是来自eWOM的文本信息及其使用文本分析的分析[17]。示例应用包括Sun等人的工作[18]通过分析餐馆eWOM以通过情感分析来定义与消费者满意度相对应的数值特征，从而改善了CF性能同样，主题建模技术已与CF一起使用，以帮助估计消费者或物品之间的相似性[19]。最后，Zhang et al.在2018年 [20]使用消费者或物品特征来识别集群，然后找到集群之间的相关性，以解决数据稀疏问题。最近，人们对使用消费者的个性以更好地理解和匹配他们的需求产生了浓厚的兴趣，因为“个性”涉及个人的感知，感受，动机和偏好[ 21 ]。与传统方法相比，用户个性的应用提高了旅游领域兴趣点推荐的性能[22]。基于个性的推荐也被证明可以大大减少冷启动和数据稀疏问题，并提高在线广告，社交媒体，书籍和音乐等领域的推荐性能[23]。然而，这些方法没有利用来自网络上的用户的eWOM数据来提取他们的偏好和他们的个性。它们主要侧重于从专门的问卷中提取用户数据，以收集消费者的行为和个性。这样的方法不能不断更新系统，因为耗时的问卷调查，导致有限的更新推荐系统的知识。这导致了对用于提取消费者个性的自动化手段的需要，下面讨论。2.2. 文本中的个性特征提取人格是一组个人的特征和行为多年来，人们已经证明，一个人的人格特质会影响他/她生活的许多领域，例如动机，偏好以及消费者偏好和行为[22]。自动化个性预测的应用已经被用于来自各种社交网络（例如Facebook、Twitter）的数据，以探索个性与不同用户活动、购买行为和对特定美食的喜爱之间的相关性[24]。两种最流行的基于文本的人格分类方法基于Myers-Briggs类型指标（MBTI）和大五人格特质，这是由于这些模型上的标记数据 MBTI专注于四个维度，涉及八种关键类型的人的特征/行为：外向或内向，感觉或直觉，思考或感觉，判断或感知。这些特征的组合可以塑造16种不同的人格类型，并将人们分类到适当的人格集群[25]。大五人格模型在以下五个维度中表达人格，以高/低的二元状态表示：宜人性、外向性、经验开放性、尽责性和神经质。这种分类法被认为是定义人格最基本方面的有效机制，描述了反映其行为的人的特征[26]。个性预测是个性感知推荐系统的一个重要阶段，这样做的两种主要方法是通过问卷调查和自动化手段[27]。一般来说，问卷在评估人格方面更准确;然而，通过利用用户的现有数据（可以是文本、图像、视频、喜欢（行为数据）等），该过程是乏味的，而自动化方法更容易进行。[28]。从文本中预测个性是一种流行的自动化方法，其基于个性理论，声称词语可以揭示文本作者的某些心理状态和个性主要有两类技术，基于特征的和深度学习：前者使用与个性相关的特征的unigram/n-gram（开放词汇方法）或词典（封闭词汇），后者利用以无监督方式从大型文本语料库中学习的文本嵌入（语言模型）。基于特征的方法利用Maireesse [29]和语言查询和字数统计技术[30]。来自这些技术的特征被馈送到不同的机器学习分类器（例如，朴素贝叶斯，支持向量机）进行预测。然而，获得这样的特征是一个昂贵的过程，并不能有效地表示原始文本的语义。为了避免特征工程，使用深度神经模型和语言模型来学习文本表示，这目前可以提高准确性。深度模型关注文本的上下文，而不仅仅是单词或句子的静态表示这些类型的深度学习技术使用注意力机制[31]，专注于根据文本中的使用方式为单词赋予权重，使它们也能够捕获语义内容[32]。一种流行的架构是利用变压器神经网络的双向编码器表示（BERT）。基于注意力的转换器已经表明，收集文本的语义可以提高ML个性模型的性能水平和预测准确性[33]。鉴于此，本文提出的方法利用基于注意力的个性预测。大多数利用大5和MBTI的人格预测方法对人格模型的每个维度使用二进制分类器例如，用于大5中的外向-内向的分类器等。这样的方法需要具有个性类的预先标记的数据。该过程的第一步是将文本矢量化为可以通过ML算法处理的形式[34]。在深度学习方法（BERT）的情况下，这可以使用开放/封闭词典或句子嵌入来完成矢量化数据用于使用数据标签训练分类器或微调预训练模型，如BERT的情况经过训练和验证的模型可以用于预测看不见的数据。3. 技术背景所提出的方法利用自动化的eWOM主题建模的主题中讨论的评论的文本3.1. 主题建模主题建模是一种流行的工具，用于从非结构化数据中提取信息，并在这项工作中使用，以确定消费者在eWOM中讨论的主题。主题模型通常涉及旨在找到文档集合中出现的主题的统计模型[35]。两种最流行的主题分析技术是潜在狄利克雷分配和结构主题模型（STM）。在这项研究中，STM方法[36]用于使用从TripAdvisor收集的评论开发主题模型STM中的每个主题表示在语料库中一起频繁出现的词的集合，并且每个文档与每个文档的主题的概率分布相关联学习主题模型的过程始于数据预处理，包括去除常见和自定义停止词和不相关信息（标点符号），然后是标记化（将句子分解为单词标记）和词干（将单词转换为其根形式）。最初，考虑常见的停用词，并且随着模型的细化，逐渐地，与我们的目标无关的附加停用词被添加到自定义停用词的列表中，诸如人名、餐馆、城市等。最适合数据集的主题的最佳数量通过迭代过程检查主题数量（K）的不同值并检查语义一致性，在每次迭代中保持模型的可能性或排他性，直到产生满意的模型[36]。连贯性度量主题中高分词之间的语义相似程度保持可能性使用包含先前未见过的文档的测试集来测试训练的主题模型。排他性衡量的是一个主题中的热门词在多大程度上不是其他主题中的热门词。主题的命名是基于领域知识和表征每个主题的最流行的词手动执行3.2. BERT人格分类深度学习模型中的“注意力”机制的最新好处BERT使用多层双向Transformer编码器，并受到知识转移概念的启发，因为在许多问题中，很难访问足够大的标记数据来训练深度模型。在迁移学习中，预训练模型是从不代表目标问题的大量未标记数据集中学习的，但允许学习一般知识。BERT类方法提供预训练的模型，并且它们的嵌入知识可以被转移到标记数据有限的目标域使用表示实际问题的标记数据集来执行微调这样的模型;这些将模型调整到手头的任务。微调在预训练的BERT之上添加前馈层以前的工作已经证明，这种预训练和微调方法优于现有的文本分类方法。在我们的例子中，BERT模型的微调是使用公开的个性标记数据进行的。尽管基于BERT的方法取得了良好的结果，但它们的最佳性能是在短文本中报告的，这一点长文本是指具有超过512个标记的文本然而，处理这样的文本在计算上是昂贵的，因此大多数转换器模型限制了它们可以同时处理的令牌的数量在我们的案例中，消费者产生的大多数评论都超过了512个令牌的限制，因此对个性的预测被认为是一个长文本分类问题。存在不同的方法来处理这个问题，包括简单的只有头部，只有尾部或半简单的方法，这些方法要么使用文本中的顶部单词数，底部单词数，要么使用顶部/底部/重要单词的组合。这样的方法丢失信息，但具有最小的计算成本。最近的工作已经寻求通过将更复杂的模型应用于更长的文本实例来减轻计算成本约束，例如将长文本分成块并组合块的嵌入。然而，Sun et al.[37]他调查了消费者评论的不同长文本处理方法，表明最好的分类性能是用简单的方法实现的，例如只使用文本的头部或尾部标记，而丢弃所有其他内容。在这项工作中，我们探索了天真和半天真的方法，以确定一个最好的个性分类性能之前，标记用户与他们的个性。在随后的章节中描述的结果表明，朴素方法产生了最佳性能，这与[37]一致。3.3. 基于树的集成回归-XGBoostXGBoost回归在这项研究中使用，因为它在类似的问题产生了良好的效果这是一种集成方法;因此，根据先前树的预测误差，通过对每棵树的训练来构建多棵树梯度下降用于基于所有先前的树生成新的树，同时优化损失和正则化。 XGBoost正则化组件平衡了学习模型的复杂性和可预测性。在这项工作中，XGBoost用于预测用户对餐厅的评分（1到5之间），以填充用户-项目矩阵，如第4节所述。XGBoost优化需要通过调整多个超参数来最大限度地减少模型过拟合和处理数据超参数的最优值可以用不同的技术来确定，例如穷举（网格搜索），贝叶斯或随机。网格搜索方法结合了每个参数的所有可能值，以获得具有最佳性能的模型，而贝叶斯方法利用先前优化周期的结果来识别具有更高概率的超参数值，以提高分类器的性能。网格搜索更好，但速度较慢，而贝叶斯更快，但不准确。在这项工作中，网格搜索的方法是通过最大限度地提高分类性能的XGBoost模型。4. 方法用于解决我们的研究问题的方法在图1中概述，并通过以下步骤实施。1. 从TripAdvisor收集餐厅评论并使用专用网络爬虫提取消费者2. 数据预处理和后续分析准备（主题建模、个性分类）。预处理过程包括标点和URL消除、文本的降低、停用词去除、标记化、词形还原、文本缩写的收缩扩展（即，在该步骤期间，生成用户-项目矩阵，其中行对应于消费者，列对应于餐馆。矩阵的单元格包含评级，当这些评级可用时，因为游客没有访问所有餐馆;3. 开发一个主题模型，使用语料库的eWOM的文本，从eWOM中提取两个指标，每个用户的偏好和表征每个场所的主题餐厅这代表每个餐厅的共同消费者意见4. 使用两种个性分类模型（BERT）和两种长文本处理技术从eWOM中评估客户在BERT分类器训练期间采用最佳长文本处理技术。两个BERT模型是通过对两个人格数据集（MBTI人格咖啡馆[38]和Big 5 [39]）上的语言模型进行微调来开发的，其中包括标记数据;5. 出现的两个个性分类器分别用于通过对个性进行平均来标注每个评论者的个性和餐厅的个性图1：方法及其评估概述访问该场所并喜欢该场所的用户的概率（属于两个个性模型的二进制维度中的每一个的概率）6. 从个性标签和主题建模中出现的特征被共同用于增强具有额外信息的原始用户-项目矩阵该信息随后用于训练两个XGBoost回归模型，每个个性模型一个，使用1到5之间的用户评级作为输出变量。XGBoost模型使用增强的用户项矩阵进行训练每个XGBoost模型都使用超参数调整进行优化，并使用训练/测试数据分割（70/30）进行验证，并基于用户评级进行分层抽样。训练的模型用于预测用户从未去过的餐厅的用户评级7. 这两个XGBoost模型的性能与三个流行的基线模型进行了比较，即SVD，SVD++和使用初始用户项矩阵训练的NMF使用流行的推荐系统评价指标的模型的性能进行评估。5. 结果所使用的数据是指2010年至2020年期间访问塞浦路斯餐厅的客户的105，000条评论（英语），并在TripAdvisor（公开）上发布了他们对体验的意见独立用户总数为56800，餐厅数量为650。图2描述了每年评论评级的描述性统计数据对于该研究，仅考虑具有至少5个评论的用户，并且仅考虑具有至少50个评论的餐馆，从而产生1535个独立用户和437个场所。图2：2010年至2020年每年餐厅评论评级[1-5]的百分比5.1. 学习主题模型为了从eWOM中提取消费者表1中的主题的命名基于领域知识、在每个主题中具有最高概率的词和具有高Lift分数的词;Lift对在其他主题中出现频率较低的词给予更高的权重每个评论的主题的概率分布表示在评论中讨论的每个主题的概率，并且每个评论中的所有主题的概率之和评论与每个评论的主题流行度的分布相经训练的STM模型的每个评论的theta值是指主题与每个评论相关联的概率。这些theta值（如图4所示）在XGBoost模型的训练过程中与其他特征一起用作特征5.2. 个性标签为了识别具有最佳分类性能的BERT长文本方法，检查了两种技术，即朴素和半朴素方法以及具有图3：用于确定最佳主题数量的主题性能度量红色圆圈表示所选主题的K个图4：每个主题的平均theta值在工作流中使用了最佳性能对于朴素的方法，我们只使用256和512个单词作为句子长度，对于半朴素的方法，我们使用将文本分块为128个单词并组合它们的嵌入。表2中来自该过程的曲线下面积（AUC）和准确度得分显示512-naïve方法优于其他方法，因此其用于用户结果表1为STM分析中出现的主题指定名称主题名称高概率和提升分数亚洲美食中国，餐馆，印度，远，尝试市中心的餐厅镇，souvlaki，冰，奶油，岛，厨师餐厅的质量优秀，时间，惊人，质量，去了，每一个意大利美食意大利，比萨饼，意大利面，下一个，爱，年，吃清洁干净，正宗，孩子，厕所，可爱，党葡萄酒葡萄酒，当地，瓶，美妙，房子，红色音乐酒吧音乐，酒吧，饮料，晚上，朋友，晚上海鲜新鲜，鱼，熟，晚餐，许多，海鲜，时间服务食物顺序，时间，分钟，表，得到，美食品尝牛排，味道，餐，经验，特别的食物成分的质量鸡，美味，酱，山药，大虾，咖喱价格价格合理，精选，优良，品质Locationlocation，place，nice，great，sea，beach员工很棒，员工友好，气氛，真的，可爱，物有所值，物有所值，品种，价格，质量，优秀Classy/Style class，风格，露台，天窗，小，漂亮，舒适自助餐自助餐，甚至，地方，惊人的，食物传统酒馆meze，传统，塞浦路斯，家庭，酒馆对于午餐午餐，繁忙，流行，天，周末，星期天表2每种型号的长文本处理的性能结果长文本处理（越低越好）人格模型哥伦比亚联合行政协调天真-头512令牌类型量表0.8780.839大50.6790.698天真-头512令牌类型量表0.7840.759大50.6450.686Semi naive-切片文本128个标记类型量表0.6530.662大50.6050.755从这些BERT BIG 5模型中，使用卷积神经网络/SVM/MLP和语言线索作为额外特征训练的模型优于使用相同数据集训练的模型，平均准确率为57%[40]。图5示出了根据来自两个BERT分类器的检测到的个性的关于用户个性的描述性统计，所述两个BERT分类器使用两个标记数据集（MBTI和BIG5）进行微调，并且使用具有512个标记的天真头脑方法处理长文本。首字母缩略词指的是MBTI和BIG 5模型中的每一个的维度的组合。图5示出了对应于在数据集中检测到的个性维度的组合的首字母缩略词，因此未示出不存在的组合训练的BERT模型预测个性的每个维度对用户属于任何个性特质的概率进行建模（即，BIG 5中外向-内向[E/I]、神经质-冷静[N/C]、宜人-竞争[A/C]、尽责-疏忽[C/I]和开放-封闭[O/C]的概率，以及MBTI的外向-内向[E/I]、感觉-直觉[S/N]、思考-感觉[T/F]和判断-感知[J/P]在Big 5的情况下，两个BERT模型使用五个二进制分类器，模型的每个维度一个，类似地，MBTI使用四个二进制分类器。分类器预测输出变量的每个状态的标签个性标签的组合创建了首字母缩略词，如图5所示，例如MBTI中的INTP，它将个体定义为内向（I），直觉（N），思考（T）和感知（P）。类似地，Big 5首字母缩略词指的是Big 5的每个维度的组合MBTI分类器的平均性能为88% AUC，而BIG 5分类器的平均性能图5：五大人格特质（左）和MBTI人格特质（右）的分布5.3. 训练和评估XGBoost模型从两个个性模型和每次评论的主题关联中出现的增强的用户-项目矩阵用于训练两个XGBoost回归模型，每个模型用于每个个性建模方法。这两个XGBoost模型在训练之前进行了超参数调整，通过使用网格搜索调整模型基于以下性能指标比较两种型号：平均绝对误差（MAE）表示实际值和预测值之间的绝对差的平均值，均方误差（MSE）和均方根误差（RMSE）是MSE的平方根。将这两个模型与传统推荐技术（即SVD、SVD++和NMF）进行比较，揭示了基于个性的推荐技术的改进性能。表3每个型号的性能结果包含所有功能评估MBTI-XGB BIG 5-XGB MBTI-XGB BIG 5-XGB SVD SVD++ NMF公制（较低，无场地无场地更好）人格梅0.590.60.610.620.650.680.82中小企业0.710.720.730.750.870.891.22均方根误差0.840.850.880.90.930.941.1这些基准模型的方法通过调整因子个数和正则化值两个超参数对传统方法进行了优化在使用上述餐馆评论进行的实验中，使用分层采样将数据最初分成测试集和训练集（70/30），以保证所有用户评级在测试和训练样本中得到充分表示使用相同的样本对模型进行了超调、训练和测试计算了上述指标，并且出现的结果（表3）显示：（1）用户和场所个性的组合改善了结果，并证实了消费者更喜欢访问具有与他们自己相似的个性的餐馆的假设;以及（2）MBTI XGBoost模型在所有其他模型中产生了最佳性能。这两种基于个性的模型都优于传统方法，这表明使用个性和eWOM提取的主题改进了推荐。6. 结论本研究提出了一种基于个性的餐厅推荐方法，并构成了第一个研究，使用客户和场所的个性在餐厅推荐问题之它侧重于评估两个流行的人格模型，以加强餐厅推荐过程，即MBTI和BIG5。使用两个BERT分类模型从游客的eWOM中识别出个性由于训练数据的长度，在BERT模型调优期间采用了最佳长文本处理方法（naïve 512 token）。该方法通过主题建模从eWOM文本中提取用户和餐馆的讨论主题作为附加所有上述特征共同用于训练两个XGBoost回归器（每个个性模型一个），以预测消费者对未光顾餐厅的满意度。研究结果表明：首先，地点和用户个性可以提高推荐效果。其次，MBTI模型与来自eWOM的主题相结合优于BIG 5模型，并且也优于基于模型的协同过滤技术。这两个结果提供了一个第一个迹象表明，在餐厅推荐的个性考虑可以有价值的影响。未来的工作将专注于评估其他长文本处理技术，以微调BERT分类，并将结果与其他传统机器学习模型以集成方式结合，以进一步提高个性分类的性能，因为个性是增强餐厅推荐的有价值的特征。引用[1] 先生del Carmen Rodríguez-Hernández，S. Ilarri，基于AI的移动上下文感知推荐系统从信息管理的角度来看：进展和方向，基于知识的系统215（2021）106740。网址：https://doi.org/10.1016/j.knosys.2021.106740。doi：10.1016/j. 2021.106740.[2] 上午 Tommasel ， A.Corbellini ， D.Godoy ， S.Schiaffino ， Personality-aware followeerecommendation algorithms：An empirical analysis，Engineering Applications of ArtificialIntelligence51（2016）24-36.网址：https://www.sciencedirect.com/science/article/pii/S0952197616000208。doi：doi.org/10.1016/j.engappai.2016.01.016.[3] J. Gountas，S. Gountas，Personality orientations，emotional states，customersatisfaction，and intention to repurchase，Journal of Business Research 60（2007）72doi：10.1016/j.jbusres. 2006.08.007。[4] 大通法律王志文，《品牌个性维度》，《市场营销研究杂志》，1997年第34期，第347网址：http://www.jstor.org/stable/3151897。doi：10.2307/3151897。[5] 学位Kim，V. P. Magnini，M. Singal，The effects of customers 'perceptionsofbrandpersonalityincasualtheme restaurants ， International Journal of Hospitality Management 30 （ 2011 ） 448-458.网址：https://www.sciencedirect.com/science/article/pii/S027843191000109X。doi：https://doi.org/10.1016/j.ijhm.2010.09.008。[6] 例如J. Boyle，Myers-Briggs Type Indicator（MBTI）：Some Psychometric Limitations，AustralianPsychologist30（1995）71-74.网址：https://aps.onlinelibrary.wiley.com/doi/abs/10.1111/j.1742-9544 。1995.tb01750.x 。 doi ：https://doi.org/10.1111/j.1742-9544.1995.tb01750.x。[7] 室室McCrae，O.下午约翰，五因素模型及其应用介绍Journal of personality 60（1992）175doi：10.1111/j.1467-6494.1992.tb00970.x。[8] 上午Gregoriades，M.潘帕卡湾Georgiades，A Holistic Approach to Requirements Elicitationfor Mobile Tourist Recommendation Systems，in：K.阿拉伊河Bhatia（Eds.），信息和通信会议的未来，施普林格国际出版社，占，2020年，页。857-873[9] 大肠 Christodoulou ， A.Gregoriades ， M.Pampaka ， H.Herodotou ， Personality-InformedRestaurant Recommendation ， in ：上午 Rocha ， H. Adeli ， G. Dzemyda ， F. Moreira（Eds.），信息系统和技术世界会议，施普林格国际出版社，占，2022年，第10页。13-21[10] 美国Malik ，A. Rana ， M. Bansal ，A Survey of Recommendation Systems ， InformationResourcesManagementJournal33（2020）53-73.网址：http://services.igi-global.com/resolvedoi/resolve.aspx?doi=10.4018/IRMJ.2020100104。doi：10.4018/IRMJ.2020100104。[11] 上午Ansari，S.埃塞盖尔河Kohli，Internet Recommendation Systems，Journal of MarketingResearch37（2000）363-375.网址：http://journals.sagepub.com/doi/10.1509/jmkr.37.3.363.18779。doi：10.1509/jmkr.37.3.363.18779。[12] 美国芽孢阿希尔湖Lobo，数据挖掘算法在电子学习推荐系统中的适用性，ACM国际会议论文集系列（2012）1034doi：10.1145/2345396.2345562。[13] 先生尼拉希岛bin Ibrahim，N.Ithnin，N.小时Sarmin，A multi-criteria collaborative filteringrecommender system for the tourism domain using Expectation Maximization（EM）andPCA-ANFIS，Electronic Commerce Research and Applications 14（2015）542-562.网址：http://dx.doi.org/10.1016/j.elerap.2015.08.004https://linkinghub.elsevier.com/retrieve/pii/S1567422315000599。doi：10.1016/j.elerap.2015.08.004。[14] 国Silva，D. Carvalho，A.梭Pereira，F.莫朗湖Rocha，纯冷启动问题：关于如何在推荐领域征服首次用户的深入研究，信息系统80（2019）1-12。doi：10.1016/j.is.2018.09.001。[15] 美国 Natarajan ， S.Vairavasundaram ， S.Natarajan ， A. 小时 Gandomi ， Resolving datasparsity and cold start problem in collaborative filtering recommender system using LinkedOpen Data，Expert系统与应用程序149（2020）。doi：10.1016/j.eswa.2020.113248。[16] 纽约科伦河贝尔角Volinsky，推荐系统的矩阵分解技术，计算机42（2009）30-37。doi：10.1109/MC.2009.263。[17] 纽约Fan，Y.Shen，J.麦，基于数据挖掘的电子商务个性化推荐系统模型研究，载：2008年电子商务与安全国际研讨会， IEEE，2008，pp.647-651.网址：http://ieeexplore.ieee.org/document/4606146/。doi：10.1109/ISECS。2008年第106期。[18] 法律Sun，J.Guo，Y.朱，基于在线中文评论情感分析的餐厅推荐系统应用不确定性理论，万维网22（2019）83-100。doi：10.1007/s11280-018-0533-x。[19] 例如芽孢Herwanto，A.先生Ningtyas，基于关联规则和主题建模的网络文章推荐系统，社会信息学理论与应用通报1（2017）26doi：10.31763/businta.v1i1.36。[20] 梭Zhang，H.张，J.Wang，结合群体相关性和客户偏好的个性化餐厅推荐方法，信息科学454-455（2018）128-143。doi：10.1016/j.ins.2018.04.061。[21] W.运动Su，P.-小时Lin，A Study of Relationship Between Personality and Product Identity，in ： Lecture Notes in Computer Science （ including subseries Lecture Notes in ArtificialIntelligence and Lecture Notes in Bioinformatics），Volume 9741，2016，pp. 266-274 网址：http://link.springer.com/10.1007/978-3-319-40093-8_27。doi：10.1007/978-3-319-40093-8_27。[22] 小时Wang，Y.Zuo，H.Li，J.吴，具有用户个性的跨域推荐，基于知识的系统213（2021）106664。网址：https://doi.org/10.1016/j.knosys.2020.106664。doi：10.1016/j.knosys.2020.106664。[23] 水渍吴湖，加-地Chen，Y.赵，基于用户个性的个性化推荐多样性，用户建模和用户自适应交互 28 （ 2018 ） 237-276 。 URL ： https ： //doi. org/10.1007/s11257-018-9205-xhttp ：link.springer.com/10.1007/s11257-018-9205- x. doi：10.1007/s11257-018-9205-x。[24] 室下午 Karumur ， T. 没有 Nguyen ， J. 上午 Konstan， Personality ， User Preferences andBehavior in Recommender systems，Information Systems Frontiers 20（2018）1241-1265。网址：http://link.sprin

下载后可阅读完整内容，剩余1页未读，立即下载