没有合适的资源?快使用搜索试试~ 我知道了~
旅游领域多赢家选举贝叶斯推荐系统,个性化推荐多样性,偏好引出与冷启动问题实验评估
Errikos Streviniotis1, Georgios Chalkiadakis2CEURWorkshopProceedings0用于旅游领域的多赢家选举机制,用于多样化的个性化贝叶斯推荐01 希腊克里特岛工业大学,希腊哈尼亚0摘要在这项工作中,我们将社会选择文献中的几种多赢家投票规则应用于个性化推荐问题。具体来说,我们为旅游领域的贝叶斯推荐装备了这些机制,从而可以在有效地提供个性化推荐的同时,促进与旅行相关特征的多样化结果。我们的系统模拟了用户和项目(即旅游兴趣点(POI))都作为多变量正态分布。我们采用了一种新颖的、轻量级的偏好引出过程,在这个过程中,用户被呈现并被要求对少量POI相关的图像进行评分。然后,我们使用这些评分来引导对用户偏好的信念进行贝叶斯更新过程。此外,我们研究了我们的方法在我们的系统装备了关于特定游客类型(即特定年龄组的游客)的(平均)偏好的先验知识时的有效性,这些知识是根据从希腊一个热门旅游胜地的实际游客收集的问卷调查数据获得的。最后,我们通过将其应用于真实世界数据集,对我们的方法进行了系统的实验评估。我们的结果(i)突出了我们的系统成功产生了与单个用户的特定兴趣相匹配的个性化推荐的能力;(ii)证实了在用户的偏好方面使用关于游客的先验知识,基于他们的人口统计数据,指导我们的推荐系统避免了冷启动问题;以及(iii)证明了多赢家机制的使用可以产生与旅行相关特征有关的多样化推荐,并在用户系统交互有限的情况下提高系统性能。0关键词 贝叶斯推荐系统,个性化推荐,社会选择理论01. 引言0旅游推荐系统在数字指南方面起着关键作用,根据游客的偏好为游客提供各种旅游目的地可能提供的活动[1,2,3,4]。旅游推荐可以大致分为酒店推荐系统、餐厅推荐系统、与团体推荐相关的旅游推荐系统、旅游规划(或旅行套餐);以及旅游景点推荐系统(即兴趣点、博物馆等)[5]。然而,在复杂的旅游领域,用户-物品评分通常与其他领域(例如电影领域)相比非常稀疏,因此采用经典的推荐系统方法,例如协同过滤技术,可能是一项复杂的任务[6]。此外,许多游客0RecSys Workshop on Recommenders in Tourism (RecTour2022),2022年9月22日,与第16届ACM推荐系统会议同时举办,地点:美国华盛顿州西雅图 Envelope-Openestreviniotis@intelligence.tuc.gr (E. Streviniotis); gehalk@intelligence.tuc.gr (G. Chalkiadakis)0© 2022 本文的版权归作者所有。根据知识共享署名4.0国际许可证(CC BY 4.0)许可。0ISSN 1613-0073 CEUR研讨会论文集(CEUR-WS.org)0当游客访问旅游目的地时,时间有限,因此推荐系统应能够提供高效的推荐,以最大程度地满足他们对轻量级用户系统交互的满意度。最后,游客通常使用他们的手机作为一种工具,以利用未知的目的地。因此,开发使用计算效率高的算法的推荐系统,这些算法可以在用户的移动设备上运行,具有至关重要的意义。在这种背景下,在这项工作中,我们介绍了一个用于旅游领域的个性化贝叶斯推荐系统,并在希腊的一个旅游目的地的真实数据集上进行了评估,具体来说是克里特岛的阿吉奥斯尼科拉斯。该数据集是为了一个真实世界的旅游规划推荐系统的需求而创建的,该系统目前正在与一家电子商务公司和相应的市政当局合作开发。一般来说,贝叶斯方法能够提供高效的推荐,最重要的是,这些技术可以应用于实时移动推荐服务[7]。更详细地说,通过利用以下方式收集的关于兴趣点(POI)和用户偏好的真实世界数据:(i)阿吉奥斯尼科拉斯克里特市政当局提供的信息和数据;(ii)在线来源;和(iii)游客填写的问卷调查。我们提出了一种基于图像的过程来引出用户的偏好,通过高效地更新系统对用户兴趣的信念,采用了计算高效的贝叶斯更新过程,利用了先验的共轭性质。此外,我们通过从真实世界游客的问卷中获得的先验知识,装备我们的系统,并对其有效性进行了实验研究。然而,我们在本文中的主要贡献是提出了一种新颖的推荐机制,可用于增加最终个性化推荐的多样性(而不仅仅是“贪婪”地推荐迄今为止被认为是最佳的POI)。这种多样性很重要,并有助于推荐的整体质量,特别是当这些推荐不依赖于其他游客/用户的评级,而是严格个性化的(在这种情况下,它们是根据与所涉及的用户的少数交互而产生的)。我们的机制受到社会选择理论中使用的多赢家选举规则的启发[8],并且这些规则具有关于选举获胜者集合满足的性质的理论保证(例如,代表性的比例)。具体来说,我们的方法创建了一个“个性化选举”,以“选举”一组�“获胜者”(对应于针对旅游者用户的�最终推荐)。我们研究了几种投票规则,并表明这种方法是有用的,因为它提供了与旅行相关特征(例如,文化、历史、美食)有关的多样化结果。例如,假设用户由于各种原因(例如,可能时间紧迫)只对文化POI进行了高评分,当访问一个旅游目的地时。产生多样化的最终推荐(即一组“选举获胜者”),将向用户呈现与各种类别相关的POI,而不仅仅是与文化相关的POI——这实际上有望增强游客的体验。因此,我们的方法可以被认为是旨在解决这一领域中经典的探索与开发问题的体现。我们的实验证实,使用多赢家选举可以提高系统在用户系统交互有限的情况下的性能,而这种优势在用户系统交互增加时会减少或消失。据我们所知,这是第一次在推荐系统文献中使用这种方法。0最后,我们通过将其应用于所讨论的热门希腊岛度假胜地的真实数据集,对我们的推荐系统进行了系统实验评估。我们的结果证实了我们的方法的有效性,并突出了它根据用户的偏好和兴趣提供顶级个性化推荐的能力。02. 背景和相关工作0在本节中,我们为这项工作提供了必要的背景。具体地,我们首先简要回顾了旅游领域个人用户的一些推荐系统。最后,我们描述了社会选择理论的一些著名概念,并提出了多赢家选举的几个规则。02.1. 个性化推荐0一般来说,旅游是一个包含各种不同类型物品的领域(例如,休闲POI,文化POI等),而且与用户的偏好和兴趣高度相关。因此,开发高效的推荐系统方法对于这样的领域至关重要。有大量的旅游或旅行导向的推荐系统,可以根据不同的类别进行分类,如[5]所列。其中大多数系统推荐与旅游相关的POI(例如餐馆、酒店、历史遗址或博物馆),这些POI理想情况下与每个游客的偏好高度相关。在这里,我们简要回顾了一些代表性的这样的系统。Borràs等人[10]提供了旅游推荐系统算法的广泛概述。作者讨论了替代用户界面、推荐技术和这种系统可能提供的其他服务。Sánchez和Bellogín[11]提出了一份利用基于位置的社交网络进行POI推荐的推荐系统调查,并讨论了这种方法的开放挑战。Zeng等人[12]为移动设备引入了一个餐厅推荐系统。具体地,他们的方法采用基于用户过去访问的餐馆的用户偏好模型,并通过利用用户的确切位置来产生最终的推荐。Kbaier等人[13]开发了一个混合推荐系统,通过结合协同过滤、基于内容的过滤和人口统计过滤三种不同的技术来生成个性化推荐。Gavalas等人[14]提出了一种名为eCOMPASS的个性化旅游规划器。在他们的工作中,该系统通过考虑天气预报和游客可以使用公共交通工具在POI之间移动的可能性,推荐个性化旅游路线,即包含多个POI的路线。PersTour[4]是另一个为游客推荐多个POI的推荐系统,它考虑了特定POI的受欢迎程度和特定游客的偏好。此外,PersTour根据POI对游客的兴趣的相关性修改游客对特定POI的参观时间。Mishra等人[15]引入了一个利用情感强度分析器(SIA)的推荐系统,以便通过探索其他游客的可用评论找到特定用户最合适的POI。在[16]中,作者介绍了一种基于图片的推荐方法,该方法为特定个人建议旅游目的地。具体地,用户选择任何一组图片,然后将其用作计算机视觉的输入0生成描述游客偏好的个人资料的模型。Massimo和Ricci[1,17]研究了下一个POI推荐的问题,即,给定一个特定游客已经访问的POI集合,为尚未访问的POI提供推荐。具体地,采用逆强化学习(IRL)技术来学习奖励函数和最佳POI选择策略。最后,Gavalas等人[18]对旅游领域移动推荐系统的最新技术进行了回顾。02.2.社会选择理论和多赢家选举规则0社会选择理论是一个适用于各个领域的理论框架,如经济学、政治学、计算机科学等。一般来说,社会选择理论研究个体偏好或利益的聚合机制,以达成集体选择或决策[8]。在这一领域探讨的集体决策的核心场景是基于几个选民对若干替代方案的偏好进行单个“获胜者”的选举。文献中提出了许多单赢家投票规则,其中最为人知的是多数制、波达计数、科普兰等[8]。另一种选举是选择一个�个大小的候选人组成的委员会,而不是单个获胜者,即单个替代方案。这种类型的选举也被称为多赢家选举[19],可以根据它们的类型和属性进行分类:(i)初选、(ii)多样委员会和(iii)比例代表机制。直观地说,初选机制选举一个由在某些特征方面具有最佳质量的替代方案组成的委员会,而多样委员会机制选举由在某些特征方面多样的替代方案组成的“委员会”。在我们的多赢家选举的新颖应用领域中,假设用户在访问旅游目的地时更喜欢购物。一个产生多样委员会作为最终推荐的机制,即获胜者,将向用户呈现与各种购物类别相关的POI,即珠宝店、当地产品店、服装店等。相比之下,初选机制的应用可能会产生侧重于特定购物类别的推荐,例如只有纪念品店。最后,比例代表机制选择一个能够比例地捕捉选民不同偏好的委员会。我们现在关注批准为基础的规则,其中每个选民列出她批准的候选人,即她喜欢的替代方案。最常见的批准机制是众所周知的批准投票。更详细地说,批准投票为每个替代方案的批准分配一分,然后选择得分最高的替代方案。因此,在多赢家选举中,批准投票选举一个由选民最频繁批准的�个替代方案组成的委员会[19]。在单赢家情况下,批准投票具有许多理想的特性,但在多赢家情况下无法实现比例代表[21]。值得注意的是,满足选举比例的强公理的批准规则是比例批准投票(PAV)机制。具体来说,在PAV规则下,每个选民对委员会最终得分的贡献取决于选民批准集合中被选中的候选人数量[21]。然而,Skowron等人[22]证明了根据PAV机制找到获胜者是NP难的。因此,引入了一种贪婪变体的重加权批准投票(RAV),可以被认为是PAV的一个良好近似算法[19]。形式上,RAV被定义为:0定义2.1。[19]考虑一个有�个选民的选举,第�个选民批准集合��中的候选人。RAV从一个空委员会�开始,并执行�轮。在每一轮中,它将具有最大值的∑�∶�∈��1的候选人�添加到�中。0另一个基于批准的规则是Bloc规则;根据Bloc,每个选民选择她的�个最喜欢的替代方案,机制选举一个由更频繁提到的替代方案组成的委员会[23]。最后,一个众所周知的非批准规则,�-Borda选择具有最高Borda分数的�个替代方案[23,8]。03. 我们的方法0在这项工作中,我们引入了一个系统,通过推荐“匹配”他们的兴趣和偏好的POI,来增强游客对旅游目的地的体验。受Babas等人的工作[24]的启发,我们设计了一个贝叶斯推荐系统,该系统执行贝叶斯更新,以学习用户(对应于游客)的偏好,并为她提供高效的推荐。具体而言,我们使用一个通用表示来对用户和物品(即旅游目的地的POI)进行建模—即,描述每个特征描述特定用户或物品的程度的值范围的多元正态分布。我们注意到,我们的系统不知道每个用户的真实分布,但它完全了解每个物品的分布。我们的代理,即推荐系统的目标,是“预测”描述特定用户的分布,以便向她推荐最适合她的POI,从而提高她的满意度。为此,我们的系统执行一系列“问题”,以确定用户的偏好,利用这一过程产生的数据。具体而言,我们采用基于图像的用户偏好引导方法,向用户呈现一组通用的与旅行相关的图片,并记录她的“喜好”,以建立一个用户模型。此外,我们为我们的系统配备了一些关于特定类型访客的一般偏好的先验知识,即属于相同年龄组的游客。最后,我们设计了一个受社会选择启发的机制,根据旅行相关特征,为用户产生多样化的个性化推荐。具体而言,给定一个特定的用户,我们根据她推断的模型创建一个“个性化选举”,并采用各种多赢家选举规则,以产生多样化的个性化推荐。03.1. 贝叶斯推断0当一个新用户进入我们的系统时,通常没有关于她偏好的(先验)信息提供给我们的推荐系统,即关于她的多元正态分布。因此,我们采用正态-逆Wishart(NIW)[25]共轭先验来建模系统对用户潜在参数的信念。一般来说,NIW分布是一个具有四个参数的多元连续概率分布家族,它具有01 我们稍后研究了这样一种情况,即我们的系统能够利用通过问卷调查从真实游客那里得到的关于用户基于人口统计信息的先验信息。̄(3)Ψ𝑛 = Ψ0 + 𝑆 + 𝜅0 ⋅ 𝑛 ⋅ ( ̄𝑥 − 𝜇0) ⋅ ( ̄𝑥 − 𝜇0)𝑇(4)̄̄̄𝑛𝑛(7)0多元正态分布具有未知均值和协方差矩阵的共轭性质。使用共轭先验可以得到后验分布的闭合形式,从而实现计算高效的贝叶斯更新过程[24]。具体而言,我们可以使用从数据中抽取的样本来更新先验超参数— � 0,� 0(均值向量),�0(自由度)和 Ψ 0(精度矩阵),得到后验超参数,如下: � � = � 00其中 �� 是样本均值, � 是样本数量, � � 是从数据中抽取的样本, �是散点矩阵。最后,我们可以使用逆Wishart和正态分布来推导给定更新后信念的协方差矩阵 Σ和均值 �,如下:03.2. 推荐过程0首先,当用户在系统中注册时,偏好引导程序开始。更详细地说,偏好引导程序是一个迭代过程,在每次迭代中,我们的系统向用户呈现 �个备选的通用图像。我们使用术语“问题”来指代这样一组通用图像的呈现。这些通用图像,类似于POI,被表示为多变量高斯分布。每个通用图像对应于特定类型的POI,即餐厅、纪念碑、海滩等。我们选择基于图片的方法来引导用户的偏好,因为旅游产品存在很大的复杂性[6],而这样的方法已经被有效地应用于引导与旅行相关的偏好[26,27]。我们强调,通用图像的集合和POI的集合没有共同的元素(即没有属于两个列表的项目)。请注意,我们的代理根据可用信息(由多变量分布表示)选择向用户呈现哪些通用图像,关于她的偏好(见第3.3节)。然而,当一个新用户进入系统时,大多数情况下我们没有关于她的可用信息,因此我们必须在第一次迭代中随机选择一些通用图像,除非我们的系统有一些先验知识可以利用(例如,关于特定年龄组的偏好的先验知识,正如我们在第4.1.2节后面讨论的那样)。在这种情况下,我们的推荐系统能够利用额外的知识来挑选将在第一次迭代中呈现给用户的图像。一旦我们的算法选择了将呈现给用户的通用图像,用户就会选择对她来说最“吸引人”的图像,0她的兴趣,并根据5级Likert量表对其进行评分,其中5意味着这张图片完全符合她的喜好。在我们的方法中,类似于[24],我们使用Kullback-Leibler(KL)散度标准来计算基于她的偏好和兴趣的任何项目(通用图像或POI)与任何用户之间的相似性。特别是,知道用户和项目都共享一个共同的表示方式——因为两者都被建模为多元正态分布——我们可以使用KL散度标准来找到他们的分布“有多相似”。形式上,维度为�的高斯�和高斯�之间的KL散度由以下公式给出:0��(�||�)= 02log|�−1��02��((�−1���)−1)−02(�� − ��)��−1�(�� − ��)(8)0其中��,��,��和��是分布的参数,��(�)是相应矩阵的迹[28]。原则上,高斯�和高斯�之间的小KL散度意味着它们相似,而大的KL散度意味着分布不相似。因此,在我们的工作中,我们做出了一个自然的假设,即用户�和项目�的分布越相似,用户对项目的评分(�对�的评分)就越高。因此,用户(表示为高斯�)对项目(表示为高斯�)的(预测)评分可以定义为:0��,� = � − ��(�||�)0�(9)0其中�是用户可以给项目的最高评分,即�=5。然后,根据提供的评分,我们的系统从所选通用图像的分布中绘制适当数量的样本。具体来说,我们使用逻辑函数[29]和用户的评分来计算将从通用图像的分布中绘制的确切样本数量。直观地说,这个函数的形式适合我们的目的,因为高评分(表示用户喜欢通用图像)意味着用户和图像的分布相似,因此从图像的分布中绘制足够多的样本将有助于构建关于用户偏好的良好模型;而低评分意味着用户认为这张图片不太符合她的偏好。因此,应该绘制少量样本,因为它们不代表用户的兴趣。一旦用户输入她的评分,我们的方法执行贝叶斯更新,以产生结合先验知识和这次迭代的新数据的更新类型用户(即分布),这对应于用户-系统交互。请注意,迭代�中导出的后验概率将成为迭代�+1的先验概率,根据这个先验概率,我们的系统将选择下一个要向用户展示的通用图像(见第3.3节)。也就是说,每次迭代中的通用图像是基于上一次迭代更新的信念选择的。这个过程在�次迭代后终止。因此,我们的系统根据NIW分布的超参数(见第3.1节)估计用户的参数(�,Σ)。最后,我们的系统的贪婪版本利用用户的估计参数来产生最终的推荐,通过应用KL散度——即贪婪地推荐与游客推断模型更相似的�个POI。我们注意到,更多的用户-系统交互,即更多的�次迭代,可以为我们的系统提供关于特定用户特征偏好的更好指示,从而产生更具代表性的用户模型。0图1:偏好引导过程和贝叶斯更新。03.3. 通用图像选择0我们推荐系统的一个关键方面是选择一种有效的方法,该方法决定在每次迭代中向用户显示哪些项目。项目选择方法应以有效的方式处理勘探与开发的两难问题,以提高系统的性能。在我们的工作中,我们研究了三种替代的项目选择方法,即:基于KL散度的贪婪机制,VPI勘探[24]和Boltzmann选择。Boltzmann选择机制表现更好,因此我们在这里详细介绍这种方法。值得注意的是,在实验评估中,结果仅对应于这种机制。直观地说,Boltzmann勘探[30]告诉我们根据其平均奖励的概率选择行动。因此,具有更高平均奖励的行动被更高概率地选择。形式上,每个时间步�,我们的代理根据以下公式为每个项目�分配选择概率:0��(�) = ���,�/�0∑��=1���,�/�(10)0其中�=����,其中�是一个常数值,��,�是方程9中计算的数量,�<1。在这种方法中,探索与开发的权衡是通过温度参数�来控制的,随着时间的推移,温度参数逐渐减小以逐渐减少探索。具体来说,对于�的值非常小,平均奖励最高的行动(在我们的案例中,最高预测0��,�评分)更有可能被选择。另一方面,在初始阶段,当�的值很大时,Boltzmann方法有效地对应于随机策略。03.4.使用多赢者选举机制生成个性化推荐0如第3.1节所述,我们的系统通过贝叶斯推断过程学习用户的偏好,该过程“构建”描述用户与某些与旅行相关的特征相关的分布。此外,我们的推荐系统贪婪地推荐与游客推断分布更相似的�个项目,基于KL散度标准。然而,这种方法可能导致用户将收到的最终推荐具有几个不良特性。例如,假设在偏好引导过程中,游客只选择对餐馆给予高评分。在这种情况下,“贪婪”方法将产生只与餐馆相关的推荐。这种特性在其他领域可能是可取的,比如电影(例如,动作电影等),但在旅游领域,游客希望在旅行目的地有各种不同的POI可供参观,例如餐馆、纪念碑、酒吧等。换句话说,为了让推荐算法能够为游客提供多种选择,它应该保证其最终�个推荐之间存在一定的多样性。此外,我们提醒读者,推荐质量的计算是基于迄今为止构建的用户模型。然而,这样的模型仅使用有限的用户-系统交互来构建,导致对实际用户模型的估计相当天真;因此,我们推测在最终推荐中提供多样性是有益的。因此,自然而然地,我们应用社会选择理论中的多赢者投票规则,以确保在任何特征子集方面获得多样化的结果。图2描述了我们提出的方法。一般来说,给定一组用户(或选民),�,以及他们的偏好,多赢者选举机制选择一个�大小的备选方案集(即“委员会”)。这些机制根据其类型满足特定属性(参见第2.2节)。鉴于此,我们现在详细介绍我们的方法,以便针对某些与旅行相关的特征向游客提供多样化的推荐,而不是贪婪地选择与用户推断模型更相似的POI。为此,给定一个由一组特征上的多变量高斯分布描述的特定游客,我们创建一个“个性化选举”以产生我们的最终推荐。更详细地说,给定一个用户�,我们利用她的均值向量��,以便基于�在所选旅行相关特征上的值,即��上每个(选定的)特征的值,创建一组选民。因此,我们生成一组选民�,以提供用户在特征上的偏好的比例表示,即具有高分数的特征将由比具有低值的特征更多的选民代表。具体而言,对于任何与旅行相关的特征�,具有值��,我们生成����10�个选民。此外,我们做出自然假设,即从特征�生成的任何选民:(i)赞成项目�,即POI,其在特征�上的值大于3,即��≥3;和(ii)仅当�在特征�上的值大于�时,即��,�>��,�,才更喜欢项目�而不是项目�。另一方面,备选方案集�和POI集是相同的。因此,我们可以应用02 我们注意到,如果 � �,� = � �,� ,我们会随机选择每个选民独立地更喜欢哪个物品( � � � 或 � � � )。0在这次选举中使用任何3种多赢家规则,以便能够选择几个“个性化”赢家,同时满足所选规则所保证的特定属性(例如,偏好表示的比例性),这些属性是基于旅行相关特征和游客的偏好。因此,通过不仅仅“贪婪”地推荐迄今为止被认为是最佳的景点,所提出的方法提供了多样化的推荐。这一事实在我们的实验结果中是显而易见的,我们发现使用多赢家选举可以提高系统性能,当用户-系统交互受限时,这一优势会随着用户-系统交互的增加而减少或消失。我们还指出,这种方法允许我们根据任何选择的旅行相关特征的子集提供多样化的推荐。更详细地说,我们的方法可以通过创建“个性化选举”来保持这种属性,其中选民仅来自于本节中已经描述的所选特征子集。(当然,备选项集仍然保持不变—即它包括所有可用的景点。)0图2:生成最终个性化推荐的社会选择启发机制。03 在我们的下面的实验中,我们测试了几种多赢家选举规则—具体来说,AV、RAV、�-Borda和Bloc(见第2.2节)。04. 实验评估0在本节中,我们进行了一系列实验,以评估:(i)我们的方法学习用户偏好并提供高质量推荐的能力;以及 (ii)几种多赢家选举机制在最终推荐质量方面的表现。我们使用了一个真实世界数据集,包括希腊岛上一个热门旅游胜地的430个景点。除了可用的景点外,我们还使用了90张通用图像进行偏好引出过程。请注意,对于这一系列实验,我们假设每个用户、景点和通用图像都可以描述为多元正态分布,其中 � =12。具体来说,我们考虑了以下与旅行相关的特征:文化、阳光和海滩、历史/考古学、冒险/运动、价格实惠、家庭友好型活动和设施、乡村旅游、豪华住宿、夜生活、美食/烹饪、一般购物和购物本地产品。我们注意到,所有实验系列的Boltzmann探索参数都设置为:� = 1,� = 0.5,�≤ 3,其中 � 0 = 0,� �+1 = � � + 1。04.1. 个性化推荐0首先,我们进行了一系列实验,用于评估我们个性化推荐方法的贪婪版本,使用合成游客。更详细地说,我们使用通过问卷收集的实际游客的偏好相关数据,为年龄段18-25、26-35、36-45、46-55、56-67和67岁以上分别生成了500名合成游客,即总共3000名合成用户。对于问卷提供的12个特征,计算了每个年龄组的平均答案(即问卷上记录的1到5的值)。为了为每个年龄组生成合成用户,我们从多元正态分布中取500个样本,其均值向量是12个特征的平均值;协方差矩阵是对角线的,每个对角线元素取值都等于1。我们进行了一系列用户-系统模拟,其中包括不同的石板大小,即每个问题中向用户呈现的通用图像数量 � = {1, 2, 3, 4, 5},以及问题数量 � ={1, 2, 3, 4, 5}。最后,对于每个 ��, ��组合,我们进行了1000次模拟:在每次模拟中,我们随机选择了3000名合成用户中的一名游客。作为评估指标,我们使用方程式 9比较了代表用户实际偏好的真实分布与她推断出的分布,即我们的算法通过偏好引出方法构建的分布(见第3.2节)。接下来,我们用 �简称这个结果的“预测评分”指标。请注意,如果推断出的分布与真实分布完全相同,该指标的值将等于5,即用户对物品的最高评分。04.1.1. 未使用先验知识0表1展示了“贪婪”方法在第一组实验中的结果,该方法不利用任何关于用户的先验知识,即系统没有关于用户年龄组的任何信息,而是使用一个无信息的先验(即每个维度都包含值为1的均值向量和对角协方差矩阵,其中每个对角线元素都取值为2)。请注意,所呈现的结果是平均值𝑛 = 1𝑛 = 2𝑛 = 3𝑛 = 4𝑛 = 5𝑚 = 12.62.853.023.123.24𝑚 = 22.743.063.243.393.5𝑚 = 32.813.153.43.543.670表1 使用无信息的先验(未利用先验知识)的�结果。0对于每个��,��组合设置进行了1000多次模拟。我们可以看到,对于�在不同设置下固定的情况,我们的算法所实现的�指标随着问题数量,即�的增加而增加。这样的结果是预期的,因为当系统向用户提出更多问题时,会揭示更多关于她偏好的信息,因此我们的方法能够根据用户的偏好构建更好的模型。此外,对于固定数量的�个问题,我们观察到随着�(即每个问题显示的备选图片数量)的增加,实现的�也在增加。这是因为当系统向用户提供更多选项时,更容易找到最能捕捉她偏好的图片。因此,通过增加选项�,我们的系统能够构建更好的用户模型,因为它能够利用关于用户兴趣的更高质量信息。接下来,我们使用了另一个基于推荐的POI质量来衡量我们方法效果的指标。具体来说,对于与系统交互的每个个体,我们使用她的“真实”分布来创建列表�����,其中包含了这个特定用户的前�个POI(即给定一个用户�,数据集中得分最高的�个POI)。同时,我们使用为这个用户推断的模型(即我们的系统通过偏好引出过程创建的分布)来创建列表����,其中包含了推断用户的前20个POI。因此,我们可以通过找到这两个列表共享的公共元素,即POI,来衡量列表�����和列表����之间的相似性:也就是说,我们计算了这些(真实)用户的前�个项目中有多少与推荐的前20个项目相符。对于这组实验,我们设置了�={20, 43,86}。请注意,“前20”仅对应我们数据集的4.5%。同样,“前43”仅占我们数据集的10%,而“前86”占20%。表2显示了每个��,��组合的1000次模拟的平均值。如图所示,对于给定的�(或给定的�),列表�����和列表����共享的公共元素的百分比随着�(或�)的增加而增加。这是自然的,因为对于较大的�(或�),我们的系统收集了更多关于用户偏好的信息,因此能够提供更好的推荐。举例来说,在�=5,�=5的设置中,我们的代理推荐的POI中有38.82%位于每个用户的前20个POI中。相应地,57.81%位于每个用户的前43个POI中,75.19%位于每个用户的前86个POI中。因此,仅仅与每个用户进行少量互动后,我们的方法就能够提供在很大程度上与用户兴趣相匹配的推荐。04.1.2. 利用先验知识0在这里,我们研究了这样一种情景,即我们的系统可以利用一些关于一般用户类型偏好的先验知识。具体来说,我们构建了一些与年龄相关的先验知识,即𝑛 = 1𝑛 = 2𝑛 = 3𝑛 = 4𝑛 = 5𝑚 = 1𝑡𝑜𝑝 − 2013.75%17.9%21.52%24.11%27.3%𝑡𝑜𝑝 − 4325%32.66%35.91%40.92%43.08%𝑡𝑜𝑝 − 8638.43%47.49%54.43%55.95%59.53%𝑚 = 2𝑡𝑜𝑝 − 2013.86%21.17%23.94%27.15%30.32%𝑡𝑜𝑝 − 4325.27%32.78%41.19%44.67%47.33%𝑡𝑜𝑝 − 8638.49%49.37%54.93%60.73%65.37%𝑚 = 3𝑡𝑜𝑝 − 2014.06%21.94%27.5%30.29%35%𝑡𝑜𝑝 − 4325.58%34.67%42.94%46.79%52%𝑡𝑜𝑝 − 8638.63%53.92%59.94%65.89%70.41%𝑚 = 4𝑡𝑜𝑝 − 2014.31%23.3%29.28%33.36%36.16%𝑡𝑜𝑝 − 4327.01%36.52%43.66%51.63%55.78%𝑡𝑜𝑝 − 8642.09%54.15%63.48%69.67%72.67%𝑡𝑜𝑝 − 2014.48%23.46%30.37%35.74%38.82%0表2 “top-20”, “top-43”和“top-86”之间 � ���� 和 � ��� 的相似性(无信息先验)。0利用从实际游客那里通过问卷收集的数据,关于属于相同年龄组的游客的一般偏好的先验分布。这些先验分布的构造方式与我们从中抽取合成用户的方式完全相同,唯一的区别在于我们插入了更高的不确定性,即对角协方差矩阵元素的值等于2。在这种情况下,我们研究了我们的推荐系统对每个年龄组的性能,并将其与我们没有这些额外信息时的情况进行了比较。对于每个年龄组,我们通过本节开头已经描述的过程生成了1000个用户,以及它们相应的先验分布。表3、4、5和6描述了18-25、26-35、36-45、46-55、56-67和67岁以上年龄组的1000次模拟的平均结果。更详细地说,表3和5捕捉了我们的方法在没有先验信息时对每个年龄组的性能。再次,我们使用 �指标来评估我们系统的推理和用户“top-20”中推荐的POI的数量。表4和6展示了当我们的系统知道用户的年龄组并因此可以利用其对该年龄组偏好的先验知识时,我们相应的结果。首先,我们注意到,在拥有这样的先验知识的情况下,我们的推荐系统明显且一贯地优于没有可用先验知识的版本。此外,系统能够仅在用户和系统之间进行有限的交互,即当 � 和 �的值较小时,就能提供高得分的推荐,远远优于无信息版本。然而,随着 � 和 �值的增加,两个版本的性能差距减小。这样的结果是预期的,因为先验知识为我们的系统提供了关于用户偏好的见解。当然,考虑到通用的与年龄相关的先验是如何构造的,以及相应的合成用户分布与先验密切相关,这些结果必须带着一颗谨慎的心来看待。然而,它们确实表明高质量的先验确实可以被我们的系统利用。此外,该实验提供了对该方法行为的进一步见解,给出了以下有趣的观察:请注意,有了可用的先验知识,存在这样的情况,即我们的方法在使用KL-散度进行推荐时,随着提出更多问题或显示更多图片,性能会下降(参见表6)。𝑚 = 12.983.253.443.533.62.722.953.143.263.3667+2.492.682.832.953.06𝑚 = 218 − 252.813.153.43.543.6826 − 352.973.33.493.653.7336 − 453.13.443.643.783.8746 − 553.193.443.643.753.8356 − 672.883.173.363.493.5867+2.692.93.083.093.31𝑚 = 318 − 252.853.33.573.743.926 − 353.033.433.713.823.8936 − 453.133.573.813.964.0646 − 553.213.573.793.923.9956 − 672.933.33.523.663.812.713.013.223.383.51𝑚 = 13.943.983.9944.014.044.14.124.134.143.9444.014.024.0256 − 673.9743.983.983.9867+3.683.713.723.743.73𝑚 = 218 − 254.214.154.164.184.1926 − 353.843.933.964.064.0736 − 454.034.144.154.184.2146 − 553.864.054.074.064.1356 − 673.953.963.973.993.9967+3.783.793.773.763.77𝑚 = 318 − 254.194.24.174.24.2126 − 353.753.9744.094.1136 − 453.974.184.194.224.2546 − 553.874.074.14.14.1256 − 673.93.963.973.984.013.753.783.783.763.78𝑚 = 112.71%18.56%21.56%23.45%25.06%16.64%23.01%26.54%30.32%31.31%14.78%21.02%24.28%26.39%28.76%56 − 6713.99%18.81%22.84%26.23%27.9%67+14.8%17.95%20.82%23.75%25.75%𝑚 = 218 − 2514.76%20.38%25.9%29.12%32.17%26 − 3512.76%20.27%23.4%27.4%28.34%36 − 4517.55%25%29.8%35.29%36.76%46 − 5516.78%22.59%29.14%30.64%33.35%56 − 6715.53%21.32%25.64%28.51%30.5%67+17.9%19.64%23.93%24.05%28.4%𝑚 = 318 − 2514.9%23.97%28.53%31.47%35.18%26 − 3512.8%21.49%27.34%29.15%30.86%36 − 4517.18%27.96%34.41%39.09%41.28%46 − 5516.79%25.65%29.98%32.9%36.99%56 − 6714.46%22.93%28.49%31.56%35.6%15.32%21.08%25.37%28.08%32.16%𝑚 = 129.38%32.03%30.9%34.83%34.54%48.52%53.03%52.36%49.44%50.3%41.15%36.68%39.32%39.42%40.43%56 − 6744%43.78%42.96%43.15%42.72%67+41.53%42.84%43.09%43.94%43.43%𝑚 = 218 − 2542.4%37.05%38%38.68%38.51%26 − 3521.62%25.1%30.87%40.14%37.26%36 − 4547.74%50.4%47.86%49.95%48.95%46 − 5527.19%36.33%38.9%38.07%41.75%56 − 6731.02%34.51%40.23%39.43%44.23%67+33.27%39.75%39.6%44.64%44.14%𝑚 = 318 − 2537.25%34.71%35.2%37.02%38.25%26 − 3519.28%30.45%32.77%37.65%36.63%36 − 4546.86%49.83%47.89%48.97%49.83%46 − 5527.2%39.98%43.74%41.08%41.19%56 − 6730.72%39.96%41.44%41.2%45.31%33.95%41.82%42.09%45.14%45.64%0年龄组 � = 1 � = 2 � = 3 � = 4 � = 5018-25 2.64 2.95 3.17 3.29 3.390表3 无可用先验知识的性能( � 度量)。0年龄组 � = 1 � = 2 � = 3 � = 4 � = 50表4 有可用先验知识的性能( �
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 高清艺术文字图标资源,PNG和ICO格式免费下载
- mui框架HTML5应用界面组件使用示例教程
- Vue.js开发利器:chrome-vue-devtools插件解析
- 掌握ElectronBrowserJS:打造跨平台电子应用
- 前端导师教程:构建与部署社交证明页面
- Java多线程与线程安全在断点续传中的实现
- 免Root一键卸载安卓预装应用教程
- 易语言实现高级表格滚动条完美控制技巧
- 超声波测距尺的源码实现
- 数据可视化与交互:构建易用的数据界面
- 实现Discourse外聘回复自动标记的简易插件
- 链表的头插法与尾插法实现及长度计算
- Playwright与Typescript及Mocha集成:自动化UI测试实践指南
- 128x128像素线性工具图标下载集合
- 易语言安装包程序增强版:智能导入与重复库过滤
- 利用AJAX与Spotify API在Google地图中探索世界音乐排行榜
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功