没有合适的资源?快使用搜索试试~ 我知道了~
结合主题模型的餐厅推荐系统
CEUR诉讼http://ceur-ws.org结合主题模型的餐厅推荐系统EvripidesChristodoulou1、AndreasGregoriades1、HerodotosHerodotou1和MariaPampaka21塞浦路斯理工大学,塞浦路斯利马索尔2曼彻斯特大学,英国曼彻斯特摘要推荐系统是一种流行的信息系统,用于支持决策者然而,尽管它们在简单的问题上取得了成功,例如音乐推荐,但它们在高度复杂的领域中表现不足,其特征在于许多参数,例如餐馆推荐。最近的研究已经认识到个性在影响消费者选择方面的重要性,但是推荐方法并没有在餐馆推荐问题中利用这一点。因此,这项工作旨在分析个性的贡献结合提取的主题,从消费者本文利用一个双向的Transformer方法与前馈分类层的个性预测,由于其在类似的问题比其他机器学习模型的性能提高。这种方法的一个问题是处理长文本,例如由不同个性类型(标签)的人撰写的叙述。因此,对不同的长文本管理方法进行评估,以找到具有最佳个性预测性能的方法。两个人格模型进行评估,即迈尔斯-布里格斯和大五,基于两个标记的数据集,用于生成两个人格分类。除了客户的个性,这项工作调查的概念,场地个性估计的用户访问了一个场地,喜欢它的个性。最后,客户和场地的个性与客户讨论的主题一起使用,形成极端梯度提升(XGBoost)模型的输入,用于预测用户对餐厅的评级。这些模型的性能相比,传统的协同过滤方法,使用各种预测指标。关键词个性预测,推荐系统,主题模型1. 介绍推荐系统已经被开发来通过解决信息过载来为消费者的决策过程提供支持 在旅游业中,他们的目标是通过更好地满足游客的需求和愿望来提高游客的体验。传统的推荐方法基于从用户的历史记录中提取的用户偏好流行的技术包括协作和RecSys旅游推荐研讨会(RecTour 2022),2022年9月22日,与第16届ACM推荐系统会议在美国电子邮件:edu.cut.ac.cy(E. Christodoulou);andreas. cut.ac.cy(A. Gregoriades); herodotos. cut.ac.cy(H.Herodotou);maria. manchester.ac.uk(M. Pampaka)0000-0002-7422-1514(A. Gregoriades);0000-0002-8717-1691(H. Herodotou);0000-0001-5481-1560(M.Pampaka)©2022本文版权归作者所有。在知识共享许可署名4.0国际(CC BY 4.0)下允许使用讲习班ISSN1613-0073CEUR研讨会论文集(CEUR-WS.org)基于内容的过滤方法。最近,人们对用户个性的利用产生了浓厚的兴趣 性格与消费者的情绪直接相关,并对满意度有很大的影响[3],理论表明具有相似性格特征的人有相似的偏好和需求[3]。用户个性的应用增强了旅游领域中的旅游者的表现,调查问卷数据或自动化个性识别的结果被发现可以改善兴趣点、目的地推荐。 同样,场地个性与品牌和满意度直接相关,但尚未在餐厅推荐中进行研究。餐馆有自己的品牌,品牌又有个性,就像人一样,吸引着性格相似的人[4]。与餐馆的概念和个性有关的消费者比那些不喜欢的人更有品牌个性起源于个性心理学[5],可以定义为与品牌相关的人类特征考虑到消费者更喜欢与他们自己的个性一致的品牌,可以通过访问场地并喜欢它的消费者来提取场地的个性这就是本研究采用的方法尽管用户和品牌个性的重要性,他们还没有被用于餐厅推荐,这使得这项工作新颖。所提出的方法利用消费者我们假设,场地个性可以提高推荐,由于用户和场地的个性之间存在的联系网络口碑代表了消费者对产品和服务的意见,并已被广泛用于识别消费者 本文评估了两种流行的人格模型,Myers-Briggs类型指标(MBTI)[6]和大五人格[7],并结合用户在电子口碑主题中表达的偏好。用户的eWOM主题和个性标签的最佳组合的识别是通过训练和比较两个极端梯度提升(XGBoost)模型来进行的,每个模型都使用以下特征:(1)使用两个候选个性模型(MBTI和BIG5)从eWOM识别的用户的个性,(2)用户从eWOM主题对场地的感知,以及(3)基于访问场地并喜欢它的用户的个性的场地的个性。由于XGBoost模型在类似的推荐问题中具有良好的性能,因此为此目的生成了XGBoost模型在这项工作中解决的研究问题是如何最好地结合用户和场地的个性模型与主题特征推断从eWOM产生最好的推荐,在流行的基于模型的协同过滤(CF)技术相比。这是我们之前工作的延续[8,9],研究了推荐系统中个性和情感的使用。这项工作的贡献有三个方面。首先,它确定了哪种长文本管理方法可以产生最佳的个性预测。其次,探讨了餐厅推荐中的场所个性概念,并评估了其影响。 餐馆的个性是从访问过一个场所并喜欢它的用户的个性来估计的。最后,它显示个性和eWOM主题的哪种组合提高了餐馆推荐。本文的结构如下。下一节介绍餐馆推荐系统的背景知识和从文本中提取个性的技术下一节将介绍使用深度神经网络识别消费者eWOM中讨论的主题和个性预测的技术。 随后的章节详细说明了所采用的方法和取得的结果。本文最后讨论了调查结果,未来的方向2. 现有知识本节回顾了推荐技术、个性化的概念,并详细阐述了到目前为止它是如何在推荐系统中使用的。2.1. 餐厅推荐系统推荐系统旨在预测消费者对他/她尚未购买的物品(产品/服务)的满意度[10]。 这是一对一营销的一部分,旨在将商品与消费者的偏好相匹配,而不是旨在满足目标市场细分的大众营销[ 11 ]。 流行的方法专注于消费者过去的经验(评级),以创建用户-项目矩阵,并根据用户或项目(产品,服务)之间的相似性预测什么更适合用户。消费者之间或产品之间的关系可以使用相似性度量来发现,这种方法被称为协同过滤(CF)[12]。 这已成功应用于旅游推荐问题,如酒店或兴趣点,并被认为是最流行的技术之一[13]。另一种流行的技术是基于内容的过滤,它试图根据项目的特征而不是他们的评级来猜测用户可能喜欢什么[ 12 ]。混合方法利用了基于内容的过滤和协同过滤的优点[10]。然而,CF技术遭受冷启动问题,当关于用户的数据非常少或没有可用数据时发生冷启动问题,因此无法识别类似的消费者[14]。此外,当用户-项目矩阵中存在大量未评级项目时,数据稀疏性会加剧问题当没有足够的数据来填充用户-项目矩阵以进行可靠的推断时,就会发生这种情况[15]。在旅游业中,由于游客在目的地停留的时间有限,收集数据既困难第一次使用者(游客)出现冷启动问题,因为没有他们在特定目的地的购买活动记录。 为了解决这些CF问题,最近的方法利用机器学习技术,如矩阵分解,使用从初始数据中出现的潜变量来近似用户-项目矩阵内容。奇异值分解(SVD)、 优化SVD(SVD++)和非负矩阵分解(NMF)模型对用户项矩阵进行分解,并预测用户对未知产品的满意度[16]。或者,基于内容的方法利用关于新产品的元数据来解决冷启动问题。获取这些元数据的有用来源是来自eWOM的文本信息及其使用文本分析的分析[17]。示例应用包括Sun等人的工作[18]通过分析餐馆的eWOM,通过情感分析来定义与消费者满意度相对应的数字特征,从而改善了CF性能同样,主题建模技术已与CF一起使用,以帮助估计消费者或项目之间的相似性[19]。最后,Zhang et al.在2018年 [20]使用消费者或物品特征来识别聚类,然后找到聚类之间的相关性,以解决数据稀疏问题。最近,人们对利用消费者的个性来更好地理解和满足他们的需求产生了浓厚的兴趣,因为“个性”与个人的感知,感受,动机和偏好有关[ 21 ]。与传统方法相比,用户个性的应用提高了旅游领域兴趣点推荐的性能[22]。基于个性的推荐也被证明可以大大减少冷启动和数据稀疏问题,并提高在线广告,社交媒体,书籍和音乐等领域的推荐性能[23]。然而,这些方法没有利用来自网络上的用户的eWOM数据来提取他们的偏好和他们的个性。他们主要侧重于从专门的问卷中提取用户数据,以收集消费者的行为和个性。这样的方法不能持续更新系统,因为耗时的问卷调查,导致有限的更新推荐系统的知识。 这导致了对自动化手段的需求,以提取消费者的个性,讨论如下。2.2. 文本中的个性特征提取人格是一组个人的特征和行为多年来,人们已经证明,一个人的性格特征会影响他/她生活的许多领域,如动机,偏好以及消费者偏好和行为[22]。自动化人格预测的应用已经被用于各种社交网络(如Facebook,Twitter)的数据,以探索人格与不同用户活动,购买行为和对特定美食的喜好之间的相关性[24]。两种最流行的基于文本的人格分类方法是基于Myers-BriggsType Indicator(MBTI)和Big Five人格特质,因为这些模型上的标记数据MBTI专注于四个维度,涉及八种关键类型的人的特征/行为:外向或内向,感觉或直觉,思考或感觉,判断或感知。这些特征的组合可以塑造16种不同的人格类型,并将人们归类到适当的人格集群[25]。大五人格模型以高/低的二元状态表达了以下五个维度的人格:可接受性,外向性,经验开放性,尽责性和神经质。这种分类法被认为是定义人格最基本方面的有效机制,描述了反映其行为的人的特征[26]。个性预测是个性感知推荐系统的一个重要阶段,主要有两种方法:问卷调查和自动化方法[27]。通常,问卷在评估个性方面更准确;然而,该过程是繁琐的,而自动化方法更容易通过利用用户的现有数据(可以是文本、图像、视频、喜欢(行为数据)等)来进行[28]第10段。从文本中预测个性是一种流行的自动化方法,它基于个性理论,声称词语可以揭示文本作者的某些心理状态和个性 有两种主要的技术,基于特征的和深度学习:前者使用与个性相关的特征的unigram/n-gram(开放词汇方法)或词典(封闭词汇),后者利用以无监督方式从大型文本语料库中学习的文本嵌入(语言模型)。基于特征的方法利用Mairesse [29]和语言查询和单词计数技术[30]。来自这些技术的特征被馈送到不同的机器学习分类器(例如,朴素贝叶斯,支持向量机)进行预测。然而,获取这些特征是一个昂贵的过程,不能有效地表示原始文本的语义。 为了避免特征工程,使用深度神经模型和语言模型来学习文本表示,这目前可以提高准确性。深度模型关注文本的上下文,而不仅仅是单词或句子的静态表示 这些类型的深度学习技术使用注意力机制[31],专注于根据文本中的使用方式为单词赋予权重,使它们也能够捕获语义内容[32]。一个流行的架构是双向编码器表示从变压器(BERT),利用变压器神经网络。基于注意力的转换器已经表明,收集文本的语义可以提高ML个性模型的性能水平和预测准确性[33]。鉴于此,本文提出的方法利用基于注意力的个性预测。大多数利用大五人格和MBTI的人格预测方法对人格模型的每个维度使用二进制分类器例如,大5中的外向-内向分类器等。这些方法需要预先标记具有个性类的数据。该过程的第一步是将文本矢量化为可以通过ML算法处理的形式[34]。在深度学习方法(BERT)的情况下,这可以使用开放/封闭词典或句子嵌入来完成矢量化的数据用于使用数据标签训练分类器或微调预训练模型,如BERT的情况经过训练和验证的模型可用于预测看不见的数据。3. 技术背景所提出的方法利用自动化的eWOM主题建模来识别评论文本中讨论的主题3.1. 主题建模主题建模是一种从非结构化数据中提取信息的流行工具,在这项工作中用于识别消费者在eWOM中讨论的主题。主题模型通常涉及旨在找到文档集合中出现的主题的统计模型[35]。两种最流行的主题分析技术是潜在狄利克雷分配和结构主题模型(STM)。在这项研究中,STM方法[36]用于使用从TripAdvisor收集的评论开发主题模型STM中的每个主题表示在语料库中频繁出现的词的集合,并且每个文档与每个文档的主题的概率分布相关联学习主题模型的过程从数据预处理开始,包括删除常见和自定义停止词和不相关的信息(标点符号),然后是标记化(将句子分解为单词标记)和词干(将单词转换为它们的根形式)。最初,我们考虑了常见的停用词,随着模型的改进,与我们的目标无关的其他停用词被添加到自定义停用词列表中,例如人名,餐馆,城市等。最适合数据集的主题的最佳数量是通过迭代过程检查主题数量(K)的不同值,并检查语义一致性,在每次迭代中保持模型的可能性或排他性,直到产生满意的模型[36]。连贯性衡量主题中高分词之间的语义相似程度Hold out似然使用包含以前未见过的文档的测试集来测试经过训练的主题模型。排他性衡量的是一个主题中的热门词汇在多大程度上不是其他主题中的热门词汇。主题的命名是根据领域知识和表征每个主题的最流行的词手动执行3.2. BERT人格分类深度学习模型中的“注意力”机制的最新好处BERT使用多层双向Transformer编码器,并受到知识转移概念的启发,因为在许多问题中,很难访问足够大的标记数据来训练深度模型。在迁移学习中,预训练模型是从不代表目标问题的大量未标记数据集中学习的,但允许学习一般知识。BERT类方法提供了预训练的模型,它们的嵌入知识可以转移到标记数据有限的目标域 微调这些模型是使用代表实际问题的标记数据集来执行的;这些数据集将模型调整到手头的任务。微调在预训练的BERT之上添加前馈层以前的工作已经证明,这种预训练和微调方法优于现有的文本分类方法。在我们的案例中,BERT模型的微调是使用公开的个性标签数据进行的。尽管BERT方法的结果很好,但人们一直批评其最佳性能是在短文本中报告长文本是指超过512个标记的文本然而,处理这样的文本在计算上是昂贵的,因此大多数transformer模型限制了它们可以同时处理的令牌的数量在我们的案例中,消费者产生的大多数评论都超过了512个令牌的限制,因此对个性的预测被认为是一个长文本分类问题。有不同的方法来处理这个问题,包括简单的只有头部,只有尾部或半简单的方法,要么使用顶部的单词数量,底部的单词数量,或者在文本中使用顶部/底部/重要单词的组合。这种方法会丢失信息,但具有最小的计算成本。最近的工作已经试图减轻计算成本的限制,通过应用更复杂的模型,以较长的文本实例,如分割成块的长文本和组合的块的嵌入。然而,Sun et al.[37]他调查了消费者评论的不同长文本处理方法,表明最好的分类性能是用简单的方法实现的,例如只使用文本的头部或尾部标记,而丢弃所有其他内容。在这项工作中,我们探索了天真和半天真的方法,以确定一个最好的个性分类性能之前,标记用户与他们的个性。 在随后的部分中描述的结果表明,朴素方法产生了最佳性能,这与[37]一致。3.3. XGBoost-基于嵌入树的回归XGBoost回归在这项研究中使用,因为它在类似的问题中产生了很好的结果它是一种集成方法;因此,根据先前树预测的错误,通过对每棵树的训练来构建多棵树梯度下降用于基于所有先前的树生成新的树,同时优化损失和正则化。 XGBoost正则化组件平衡了学习模型的复杂性和可预测性。在这项工作中,XGBoost用于预测用户对餐厅的评分(1到5之间),以填充用户-项目矩阵,如第4节所述。XGBoost优化需要通过调整多个超参数来最大限度地减少模型过拟合和处理数据超参数的最优值可以用不同的技术来确定,例如穷举(网格搜索),贝叶斯或随机。网格搜索方法结合了每个参数的所有可能值,以获得具有最佳性能的模型,而贝叶斯方法利用先前优化周期的结果来识别具有更高概率的超参数值,以提高分类器的性能。 网格搜索更好,但速度较慢,而贝叶斯搜索更快,但不准确。 在这项工作中,网格搜索的方法是通过最大限度地提高分类性能的XGBoost模型。4. 方法用于解决我们的研究问题的方法在图1中概述,并通过以下步骤实施。1. 从TripAdvisor收集餐厅评论,并使用专用网络爬虫提取消费者2. 数据预处理和后续分析准备(主题建模,个性化分类)。 预处理过程包括标点符号和URL消除、文本降低、停用词去除、标记化、词形化、文本缩写的收缩扩展(即,在此步骤中,生成用户项矩阵,其中行对应于消费者,列对应于餐馆。矩阵的单元格中有可用的评级,因为游客并没有光顾所有的餐馆;3. 开发一个主题模型,使用作为语料库的eWOM从eWOM中提取两个指标,每个用户的偏好和表征每个地点的主题餐厅这代表了每家餐馆的共同消费者意见4. 使用两种个性分类模型(BERT)和两种长文本处理技术从eWOM中评估客户在BERT分类器训练过程中采用了最佳的长文本处理技术。 两个BERT模型是通过对两个人格数据集(MBTI人格咖啡馆[38]和Big 5 [39])的语言模型进行微调而开发的,数据带有标签;5. 出现的两个个性分类器分别用于通过平均个性来标记每个评论者的个性和餐厅的个性图1:方法及其评价概述(属于两个人格模型的二进制维度中的每一个的概率)访问该场所并喜欢它的用户;6. 从个性标签和主题建模中出现的特征被共同用来增强原始用户-项目矩阵,并提供额外的信息。这些信息随后用于训练两个XGBoost回归模型,每个模型用于一个个性模型,使用1到5之间的用户评级作为输出变量。XGBoost模型使用增强的用户项矩阵进行训练 每个XGBoost模型都使用超参数调整进行优化,并使用训练/测试数据分割(70/30)进行验证,并基于用户评级进行分层抽样。训练后的模型用于预测用户从未去过的餐厅的用户评级7. 两个XGBoost模型的性能与三个流行的基线模型进行了比较,即SVD,SVD++和使用初始用户项矩阵训练的NMF使用流行的推荐系统评价指标的模型的性能进行评估。5. 结果所使用的数据是指2010年至2020年期间访问塞浦路斯餐厅的客户的105,000条评论(英语),并在TripAdvisor(公开)上发布了他们对体验的意见独立用户总数为56800,餐厅数量为650家。图2描述了每年评论评级的描述性统计数据在这项研究中,只考虑至少有5条评论的用户,并且只考虑至少有50条评论的餐馆从而产生1535个独立用户和437个场所。图2:2010年至2020年每年餐厅评论评级[1-5]的百分比5.1. 学习主题模型为了从eWOM中提取消费者表1中主题的命名是基于领域知识,每个主题中概率最高的单词和Lift得分高的单词;Lift为其他主题中出现频率较低的单词赋予更高的权重每个评论的主题概率分布表示评论中讨论的每个主题的概率,并且每个评论中所有主题的概率之和评论与每个评论的主题流行度的分布相训练好的STM模型的theta值是指主题与每个评论相关联的概率。这些theta值(如图4所示)在XGBoost模型的训练过程中与其他特征一起用作特征5.2. 个性标签为了识别具有最佳分类性能的BERT长文本方法,检查了两种技术,即朴素和半朴素方法以及具有图3:用于确定最佳主题数量的主题性能度量红色圆圈表示选定的主题数K图4:每个主题的平均theta值在工作流程中使用了最佳性能对于朴素的方法,我们只使用256和512个单词作为句子长度,对于半朴素的方法,我们使用将文本分块为128个单词并结合它们的嵌入。表2中的曲线下面积(AUC)和准确性分数表明,512-naïve方法优于其他方法,因此它被用于用户结果表1为STM分析中出现的主题指定名称主题名称高概率和提升分数亚洲美食中国,餐馆,印度,远,尝试市中心的餐厅镇,souvlaki,冰,奶油,岛,厨师餐厅的质量优秀,时间,惊人的,质量,去了,每一个意大利美食意大利,比萨饼,意大利面,下一个,爱,年,吃清洁干净,正宗,孩子,厕所,可爱,党葡萄酒葡萄酒,当地,瓶,美妙的,房子,红色音乐酒吧音乐,酒吧,饮料,晚上,朋友,晚上海鲜新鲜,鱼,熟,晚餐,许多,海鲜,时间服务食物顺序,时间,分钟,表,得到,食物品尝牛排,味道,餐,经验,特别的食物成分的质量鸡,美味,酱,山药,虾,咖喱价格价格合理精选优良品质位置位置,地点,不错,很棒,大海,海滩员工很棒,员工友好,气氛,真的,可爱,物有所值,物有所值,品种,价格,质量,优秀的Classy/Style class,风格,露台,天窗,小,漂亮,舒适自助餐自助餐,甚至,地方,惊人的,食物传统酒馆meze,传统,塞浦路斯,家庭,酒馆午餐午餐,繁忙,流行,一天,周末,星期天表2每个模型的长文本处理的性能结果长文本处理(越低越好)人格楷模AUCACC天真-头512代币MBTI0.8780.839BIG 50.6790.698天真-头512代币MBTI0.7840.759BIG 50.6450.686Semi naive-Sliced text 128 tokensMBTI0.6530.662BIG 50.6050.755从这些BERT BIG 5模型中,使用卷积神经网络/SVM/MLP和语言线索作为额外特征训练的模型优于使用相同数据集训练的模型,平均准确率为57%。图5显示了根据两个BERT分类器检测到的用户个性的描述性统计数据,这两个BERT分类器使用两个标记数据集(MBTI和BIG5)进行微调,并使用具有512个标记的天真方法处理长文本。首字母缩略词指的是MBTI和BIG 5模型中每一个维度的组合。图5显示了对应于数据集中检测到的个性维度组合的首字母缩略词,因此未显示的组合经过训练的BERT模型预测个性的每个维度对用户属于任何个性特质的概率进行建模(即,在BIG 5中,外向-内向[E/I]、神经质-冷静[N/C]、愉快-竞争[A/C]、疏忽-注意[C/I]和开放-封闭[O/C]的概率,以及MBTI中的表达-内向[E/I]、感觉-直觉[S/N]、思考-感觉[T/F]和判断-感知[J/P]的概率在Big 5的情况下,两个BERT模型使用五个二进制分类器,每个维度一个,类似地,MBTI使用四个二进制分类器。分类器预测输出变量的每个状态的标签个性标签的组合创造了首字母缩略词,如图5所示,例如MBTI中的INTP,它将个体定义为内向(I),直觉(N),思考(T)和感知(P)。类似地,Big 5首字母缩略词指的是Big 5每个维度的组合MBTI分类器的平均性能为88% AUC,而BIG 5分类器的平均性能图5:五大人格特质(左)和MBTI人格特质(右)的分布(使用每个维度的缩略语)5.3. 训练和评估XGBoost模型从两个个性模型和每个评论的主题关联中产生的增强的用户-项目矩阵用于训练两个XGBoost回归模型,每个模型用于一种个性建模方法。这两个XGBoost模型在训练之前进行了超参数调整,通过使用网格搜索调整模型基于以下性能指标比较两个模型:平均绝对误差(MAE),表示实际值和预测值之间的绝对差的平均值;均方误差(MSE);均方根误差(RMSE),即MSE的平方根。将这两个模型与传统的推荐技术,即SVD,SVD++和NMF进行比较,发现基于个性的表3每个型号的性能结果,包括所有功能评估MBTI-XGB BIG 5-XGB MBTI-XGB BIG 5-XGB SVD SVD++ NMF公制(较低,无场地,无场地更好)人格Mae0.590.60.610.620.650.680.82MSE0.710.720.730.750.870.891.22RMSE0.840.850.880.90.930.941.1这些基准模型的方法通过调整因子个数和正则化值两个超参数,对传统方法进行了优化在 使用 上述 餐馆 评论 进行 的实 验中 , 数据最初使用分层抽样分成测试和训练集(70/30),以确保所有用户评级在测试和训练样本中得到充分表示这些模型经过超调、训练和使用相同的样本进行测试 上述指标进行了计算,结果显示(表3):(1)用户和场所个性的组合改善了结果,并证实了消费者更喜欢访问与自己个性相似的餐馆的假设;(2)MBTI XGBoost模型在所有其他模型中产生了最佳性能。这两种基于个性的模型都优于传统方法,这表明使用个性和eWOM提取的主题改进了推荐。6. 结论本研究提出了一种基于个性的餐厅推荐方法,并构成了第一个研究,使用客户和地点的个性在餐厅推荐问题。它侧重于评估两个流行的人格模型,以加强餐厅推荐过程,即MBTI和BIG5。使用两个BERT分类模型从游客的eWOM中识别个性 由于训练数据的长度,在BERT模型调优期间采用了最佳长文本处理方法(naïve 512 token)。该方法通过主题建模从网络口碑文本中提取用户和餐馆的讨论主题作为附加 所有上述特征都被共同用于训练两个XGBoost回归器(每个人格模型一个),以预测消费者对未光顾餐厅的满意度。研究结果表明:首先,地点和用户个性可以提高推荐效果。其次,MBTI模型与来自eWOM的主题相结合,优于BIG 5模型,也优于基于模型的协同过滤技术。这两个结果提供了第一个迹象表明,在餐厅推荐的个性考虑可以有价值的影响。未来的工作将专注于评估其他长文本处理技术,以微调BERT分类,并将结果与其他传统机器学习模型以集成方式结合,以进一步提高个性分类的性能,因为个性是增强餐厅推荐的有价值的特征。引用[1] M. del Carmen Rodríguez-Hernández,S. Ilarri,基于AI的移动上下文感知推荐系统从信息管理的角度来看:进展和方向,基于知识的系统215(2021)106740。网址:https://doi.org/10.1016/j.knosys.2021.106740。doi:10.1016/j. Knosys.2021.106740。[2] A.Tommasel , A.Corbellini , D.Godoy , S.Schiaffino , Personality-awarefolloweerecommendation algorithms:An empirical analysis,Engineering Applications of ArtificialIntelligence51(2016)24-36.网址:https://www.sciencedirect.com/science/article/pii/S0952197616000208。doi:doi.org/10.1016/j.engappai.2016.01.016.[3] J. Gountas,S. Gountas,Personality orientations,emotional states,customersatisfaction,and intention to repurchase,Journal of Business Research 60(2007)72doi:10.1016/j.jbusres. 2006.08.007。[4] J. L. 王志文,《品牌个性维度》,《市场营销研究杂志》,1997年,第347-356页网址:http://www.jstor.org/stable/3151897。doi:10.2307/3151897。[5] D. Kim,V. P. Magnini,M. Singal,The effects of customers 'perceptionsofbrandpersonalityincasualtheme restaurants , International Journal of Hospitality Management 30 ( 2011 ) 448-458.网 址 :https://www.sciencedirect.com/science/article/pii/S027843191000109X。doi:https://doi.org/10.1016/j.ijhm.2010.09.008。[6] G. J. Boyle , Myers-Briggs Type Indicator ( MBTI ) : Some Psychometric Limitations ,AustralianPsychologist30(1995)71-74.网址:https://aps.onlinelibrary.wiley.com/doi/abs/10.1111/j.1742-9544 。1995.tb01750.x 。 doi :https://doi.org/10.1111/j.1742-9544.1995.tb01750.x网站。[7] R. R. McCrae , O.P. 约 翰 , 五 因 素 模 型 及 其 应 用 介 绍 个 性 杂 志 doi : 10.1111/j.1467-6494.1992.tb00970.x。[8] A. Gregoriades,M.潘帕卡湾Georgiades,移动旅游推荐系统需求获取的整体方法。新井河Bhatia(Eds.),信息和通信会议的未来,施普林格国际出版社,占,2020年,页。857-873[9] E. Christodoulou , A.Gregoriades , M. 潘 帕 卡 湾 Herodotou , Personality-InformedRestaurant Recommendation,in:A.Rocha,H. Adeli,G. Dzemyda,F. Moreira(Eds.),信息系统和技术世界会议,施普林格国际出版社,占,2022年,页。13比21[10] S.马利克,A. Rana,M. Bansal,推荐系统的调查,信息资源管理杂志33(2020)53-73。网址 : http://services.igi-global.com/resolvedoi/resolve.aspx? doi=10.4018/IRMJ.2020100104 。doi:10.4018/IRMJ.2020100104。[11] A. 安萨里河,西-地埃塞盖尔河许国忠,互联网推荐系统,市场研究杂志,2000年,第363-375页。网址:http://journals.sagepub.com/doi/10.1509/jmkr.37.3.363.18779。doi:10.1509/jmkr.37.3.363.18779。[12] S. B.阿赫尔湖Lobo,数据挖掘算法在电子学习推荐系统中的适用性,ACM国际会议论文集系列(2012)1034doi:10.1145/2345396.2345562。[13] M. 尼拉希岛bin Ibrahim,N.Ithnin,N.H. Sarmin,A multi-criteria collaborative filteringrecommender system for the tourism domain using Expectation Maximization(EM)andPCA-ANFIS,Electronic Commerce Research and Applications 14(2015)542-562.网址:http://dx.doi.org/10.1016/j.elerap.2015.08.004https://linkinghub.elsevier.com/retrieve/pii/S1567422315000599。doi:10.1016/j.elerap.2015.08.004。[14] N. Silva,D.卡瓦略A. C.佩雷拉湾奥桑湖Rocha,纯冷启动问题:关于如何在推荐领域征服首次用户的深入研究,信息系统80(2019)1-12。doi:10.1016/j.is.2018.09.001。[15] S. Natarajan,S.Vairavasundaram,S.Natarajan,A.H. Gandomi,Resolving data sparsityand cold start problem in collaborative filtering recommender system using Linked OpenData,Expert系统与应用程序149(2020)。doi:10.1016/j.eswa.2020.113248。[16] Y. 科伦河,巴西-地贝尔角,澳-地Volinsky,推荐系统的矩阵分解技术,计算机42(2009)30-37。doi:10.1109/MC.2009.263。[17] Y. 范,Y。Shen,J.麦,基于数据挖掘的电子商务个性化推荐系统模型研究,2008年电子商务与安全国际研讨会,IEEE,2008年,pp.647-651.网址:http://ieeexplore.ieee.org/document/4606146/。doi:10.1109/ISECS。2008年第106期。[18] L. Sun,J.Guo,Y.Zhu,基于在线中文评论情感分析的餐厅推荐系统中应用不确定性理论,万维网22(2019)83-100。doi:10.1007/s11280-018-0533-x。[19] G. B. Herwanto,A. M. Ningtyas,基于关联规则和主题建模的网络文章推荐系统,社会信息学理论与应用通报1(2017)26doi:10.31763/dota.v1i1.36。[20] C. Zhang,H.Zhang,J.Wang,结合群体相关性和客户偏好的个性化餐厅推荐方法,信息科学454-455(2018)128-143。doi:10.1016/j.ins.2018.04.061。[21] W.- Z. Su,P.-H. Lin,A Study of Relationship Between Personality and Product Identity,in : Lecture Notes in Computer Science ( including subseries Lecture Notes in ArtificialIntelligence and Lecture Notes in Bioinformatics),Volume 9741,2016,pp. 266-274。网址:http://link.springer.com/10.1007/978-3-319-40093-8_27。doi:10.1007/978-3-319-40093-8_27。[22] H. Wang,Y.左,H.Li,J.吴,基于用户个性的跨域推荐,基于知识的系统213(2021)106664。网址:https://doi.org/10.1016/j.knosys.2020.106664。doi:10.1016/j.knosys.2020.106664。[23] W.吴湖,加-地Chen,Y.赵,基于用户个性的个性化推荐多样性,用户建模和用户自适应交互 28 ( 2018 ) 237-276 。 URL : https : //doi. org/10.1007/s11257-018-9205-xhttp :link.springer.com/10.1007/s11257-018-9205- x. doi:10.1007/s11257-018-9205-x。[24] R. P. Karumur,T.T. Nguyen,J.A. Konstan,Personality,User Preferences and Behavior inRecommender Systems , Information Systems Frontiers 20 ( 2018 ) 1241-1265 。 网 址 :http://link.springer。com/10.1007/s10796-017-9800-0。doi: 10.1007/s10796-017-9800-0。[25] M. H. Amirhosseini,H. Kazemian,基于Myers-Briggs Type Indicator ®的人格类型预测机器学习方法,多模态技术和交互4(2020)9。网址:www.theijm.comhttps://www.mdpi.com/2414-4088/4/1/9。doi:10.3390/mti4010009。[26] S. 诉Paunonen,Big Five Factors of Per
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功