没有合适的资源?快使用搜索试试~ 我知道了~
CEUR:个性旅游推荐系统离线评估及性能比较
CEUR诉讼http://ceur-ws.org个性化旅游推荐系统作者:AbhishekAgarwal 1,2,Linus W. 迪茨1,21慕尼黑工业大学信息学系,Garching,85748,德国2两位作者对该论文摘要推荐系统的研究重点一直是向用户推荐合适的商品然而,在某些领域中,不仅是哪种商品,而且目标用户应该消费的数量也可以是推荐的一部分在这项工作中,我们解决了研究不足的问题,建议逗留时间的域的目的地推荐。 使用两个数据集,一个基于酒店预订,另一个基于来自地理标记的推文的移动性,我们使用无监督学习进行广泛的特征工程,以发现用户类型和城市的图形嵌入。在我们的实验中,我们将具有不同特征的监督学习算法的性能与用于预测在目的地停留时间的统计基线进行了 结果强调了任务的难度:我们使用CatBoost的个性化移动嵌入获得了酒店预订数据集的最佳结果。同时,在嘈杂的Twitter数据集中,推荐所有用户的模式持续时间的简单策略关键词目的地推荐,停留时间,特征工程,图形嵌入,离线评估,1. 介绍推荐系统研究的主流是使用稀疏的评分矩阵来预测项目对特定用户的适合性自协同过滤的早期开始以来,推荐算法已经达到了极大的成熟度[ 1 ],以至于目前还不清楚新方法是否可以在排名准确性方面优于长期建立的算法[2]。当前的推荐挑战包括确保公平性[3,4],多边市场[5]和顺序推荐[6]。不像这些推荐研究问题,这是与选择合适的项目和确定的排名,我们分析的问题,推荐的数量,一个给定的用户应该消费的项目。具体地说,我们的目标是评估算法,计算最佳的逗留时间在旅游目的地的酒店预订数据和旅行者的流动性的基础上在旅游推荐中,这是一个重大挑战,因为确定在特定地点停留的时间是在线旅游规划者的基石[7,8]。请注意,这个问题不同于RecSys旅游推荐研讨会(RecTour 2022),2022年9月22日,与第16届ACM推荐系统会议在美国abhishek. tum.de(A. Agarwal);linus. tum.de(L. W. Dietz)© 2022本文版权归作者所有。在知识共享许可署名4.0国际(CC BY 4.0)下允许使用讲习班ISSN1613-0073CEUR研讨会论文集(CEUR-WS.org)我们应该推荐的项目,例如,背包优化方法用于解决旅游行程设计问题[8,9],或在旅行套餐中多次推荐项目[10]。为了计算在旅行目的地停留的个性化持续时间,Dietz和Wörndl提出了一种算法,该算法依赖于对用户相对于其他旅行者的先前旅行持续时间的统计分析我们的工作有一个类似的目标,但是,我们提出了一个系统的实验设计基于两个不同的数据集。 我们比较了多个统计基线的预测性能-包括[11]中提出的方法-与经典的监督机器学习算法,这些算法具有我们从无监督机器学习中获得的不同特征。这个特征工程过程是特定于这个领域的,并进一步深入了解算法旅行规划的基本因素将推荐问题框定为定量预测任务,而不是使用调查来评估算法,结果可重复,可用于未来的研究。本文的结构如下:在即将到来的第2中,我们调查了有限的先前工作,这个开放的研究问题。第3节专门介绍两个数据集和所采用的预处理步骤。 在第4节中,我们描述了我们的特征工程工作,我们将在第5节中描述的实验中使用这些工作。我们在第6讨论我们的结果,最后在第7得出结论。2. 相关工作科学界对积极推荐物品消费时间的关注有限。项目消费的预期持续时间在序列感知推荐场景中发挥作用,例如视频推荐[12]或社交媒体上的内容推荐以预测停留时间[13]。 这与我们的方法不同,因为我们的论文中的问题是建议停留的时间,而不是访问哪个目的地。 上述方法使用预测的物品消费持续时间来优化业务指标,例如在平台上花费的总时间[14]。大多数提到推荐物品消费量的文献都可以在旅行推荐领域找到,在旅行推荐领域,它通常以特别的方式解决[9,15]或被视为未来的工作[16,17]。例如,在区域推荐系统中,旅行区域首先根据用户偏好进行评分,并组合成复合旅行[9]。作者的建议,以确定停留时间是应用一个逐渐减少的分数的旅行地区的5-10%,每周结束停留在当前地区的分数,只要下一个在计划在景点停留时,停留时间也是必要的然而,我们在文献中发现的方法也没有系统地解决这个问题。例如,使用Foursquare数据集分析了不同兴趣点类别的游客的典型停留时间,以改善上下文感知服务[18],但这种方法不是个性化的。其他系统结合平均停留时间来推荐城市内的行程[15,19],但仅将持续时间作为整体行程持续时间的一部分报告给用户这些持续时间可能源于谷歌地图等商业服务,这些服务展示了基于移动电话的人类移动性的信息这些信息不是个性化的,由于聚合,我们无法使用它来计算对个人用户的建议。它留给我们的是Dietz和Wörndl[11]提出的方法,该方法分析了基于位置的社交网络Foursquare1过去的用户行程,以了解他们的旅行节奏以前访问过的城市的平均百分位持续时间量化了给定用户的速度。为了找到目标目的地的相应停留时间段,使用该目的地中所有用户的持续时间分布来计算平均百分位数。在我们的工作中,我们的目标是系统地评估这种方法,并在接下来的章节中描述的两个数据集上进行新的机器学习。3. 数据集和预处理目前,在全球一级确定在目的地停留时间的适当数据集很少 我们在两个真实世界的数据集上进行实验,一个是由Booking.com发布的,另一个是从带有地理标签的推文中收集的旅行数据集。3.1. Booking.comBooking.com多目的地旅行数据集[17]是Booking.com WSDM WebTour 2021挑战赛2的一部分。最初的挑战涉及预测四个目的地旅行的最后一个目的地的顺序推荐问题;然而,数据集还包括在各个目的地停留的持续时间总体而言,该数据集包含超过100万个匿名酒店预订,使其成为预测住宿持续时间的合适数据集。不幸的是,匿名化掩盖了真正的目的地,这使我们无法获得更多的见解。 发布这一数据集的另一个人为因素是,用户只来自五个国家,但总共去过107个不同的国家。 由于这一数据集包括恰好由四个目的地组成的旅行,因此它是一个干净的数据集,具有国际旅行现实的相当具体的部分。3.2. Twitter为了补充Booking.com数据集,我们使用Twitter API 3来查询在其Twitter中启用共享其地理位置的用户时间线。 使用TRIPMINGLIBRARYY4,我们将用户的移动性分为在家和远离家乡的时间段[ 20 ]。只要符合特定的数据质量标准,在国外的连续期间被视为旅行鉴于基于签到的数据的性质,我们只知道用户然而,鉴于我们拥有大量的移动数据,我们可以处理每天至少有一次登记的旅行子集此外,为了匹配Booking.com酒店预订数据集的特征,我们在分析中只包括具有四个或更多目的地的多目的地旅行与Booking.com数据集类似,我们1https://foursquare.com2https://www.bookingchallenge.com3https://developer.twitter.com/en/docs/twitter-api4https://github.com/LinusDietz/tripmining没有将可用的地理信息作为训练要素,尽管知道该数据集中的真实城市名称因此,我们知道大多数用户来自该平台流行的国家,特别是美国,欧洲和日本。由于这些旅行不像Booking.com挑战数据集那样受到人为选择偏差的影响,Twitter旅行的平衡比例为97个来源国对105个目的地国;然而,大多数旅行都是国内旅行。3.3. 预处理虽然Twitter数据集可以提供更多的信息,但我们决定在两个数据集中使用相同的基本特征每次住宿的可用功能列表如下:用户ID、入住日期、退房日期、用户国家/地区、目的地国家/地区、目的地ID和旅行ID。表1两个数据集的概述Booking.comTwitter用户数96,64324,146旅行次数734,102852,131#原产国597#目的地国家107105国内旅行百分之四点五百分之九十一点三日期范围2016年1月2010年10月尽管我们在两个数据集中都有很多旅行,但一些旅行者和目的地的旅行次数不足因此,我们丢弃了行程较少的目的地和用户,以消除仍处于冷启动阶段的用户和项目对于预订,我们保留访问过五个独特目的地和至少访问过15次目的地的旅行者在更嘈杂的Twitter数据集中,我们为每个用户强制10个唯一的目的地,每个目的地至少需要访问25次。我们在表1中提供了预处理数据集的概述。在所有旅行中,Booking.com数据集中95.5%是国际旅行,而Twitter数据集中91.3%是国内旅行差异表明,这两个数据集需要分别处理和分析,因为Booking.com旅行偏向于国际旅行。相比之下,Twitter旅行反映出大多数旅行实际上是国内旅行。对图1中停留时间分布的初步观察表明,大多数旅行者在相对较短的时间内访问给定的目的地,两个数据集中的众数都为13.4. 分割成训练数据和测试数据正如机器学习中常见的那样,我们将停留随机分为训练集和测试集。测试集由每个用户随机选择的停留时间的20%组成其余行程用于特征工程,以根据用户的偏好和移动模式提取高级表示然后,这些表示和其他特征用于训练不同的统计和机器学习模型,以预测停留时间因此,预测性能与看不见的测试数据进行评估。(a) Booking.com(b)Twitter图1:逗留时间分布4. 特征工程如今,机器学习模型的性能在很大程度上依赖于算法可以直接使用的信息,但也依赖于衍生特征[21]。对于这个问题,我们根据旅行者的移动模式获得额外的功能:使用聚类分析,我们发现旅行者的类型,并计算目的地和用户的图嵌入通过这种方式,我们将有关旅行者,旅行和目的地的信息转换为适合机器学习算法的表示,以使用这些信息来预测停留时间。4.1. 记录卡类型特征旅行者类型的特征化对于个性化旅游推荐系统是必不可少的其目标是发现用户的旅行行为的基础上,他们过去的关于旅行者类型有很多研究[22,23,24,25];然而,与我们的工作最相关的是一种聚类方法,通过分析来自基于位置的社交网络的登记数据来识别旅行者类型[20],我们采用这种方法来识别这样的旅行者群体,我们稍后使用这些群体来预测给定用户的下一次旅行的持续时间聚类分析是一种无监督的学习方法,用于发现新的组,使得同一组中的成员与同一组中的其他数据成员比其他组中的成员更相似经过广泛的实验,我们决定使用六个特征进行聚类任务:国内旅行次数,访问的独特国内城市数量,国内旅行的平均持续时间,国际旅行次数,访问的独特国际城市数量和国际旅行的平均持续时间由于我们使用欧氏距离,因此我们使用最小-最大缩放来规范化这些特征 使用K-Means算法对数据进行聚类,我们将用户分成用户彼此相似但组彼此不同的组。由于该算法需要指定聚类数,因此我们通过在2到20之间改变聚类数并使用平均轮廓得分评估聚类拟合质量来运行K-means聚类算法剪影(a) Booking.com(b)Twitter图2:旅客类型聚类-轮廓分数score帮助我们了解一个聚类中的每个点与相邻聚类的接近程度,因此可以作为评估聚类数量的合适度量轮廓分数从-1到1被归一化,其中1是完美分数,即,一个与其他星系团分隔开的密集星系团较低的分数表示样本非常接近相邻聚类的决策边界的重叠聚类我们在图2和图3中绘制了两个数据集的两个轮廓分数和平方误差之和(SSE)。基于这些图,我们可以推断,对于这两个数据集,都适合使用n= 6个聚类的解决方案,因为对于更高的值,轮廓分数会(a) Booking.com(b)Twitter图3:旅行者类型聚类-平方误差和(SSE)Booking.com和Twitter的最后轮廓图显示了发现的集群,其中n= 6。这六个聚类分别代表一种不同类型的旅行者,这种旅行者不是均匀分布的。例如,在Booking.com的数据集中,两个大的集群1和5代表相对很少旅行的用户,他们只进行短期国际旅行,平均时间为1.28和2.07天。而对于Twitter,最大的集群代表经常前往其国家不同城市的用户总而言之,我们成功地(a) 预订(b)旅行者类型聚类-Twitter图4:记录卡类型聚类-最终轮廓图特征的不同类型的旅行者在我们的数据集使用聚类方法。特征化可以帮助我们根据用户的旅行者类型标签预测未来旅行的持续时间。4.2. 旅行者移动模式对人类流动模式的分析在城市规划、交通预测、流行病预防和基于位置的服务等多个领域有着广泛的应用[26]。由于我们的域是强烈的流动性的影响,我们得出几个指标的基础上表现在用户的行程的流动性模式 这些模式可以让我们深入了解用户的旅行习惯,并揭示目的地之间的相互联系。例如,已经表明可以从过去的用户行程中发现连贯的旅行区域[27],并且这些功能已经在Booking.com WSDM WebTour 2021挑战赛中证明是有用的[28]。然而,在处理匿名的www.example.com数据集时,简单地将目的地聚类到区域中可能没有帮助Booking.com,因为我们无法将目的地映射到先前识别的区域。而且,这将导致编码中的进一步的可伸缩性问题,因为维度的数量将显著增加,例如,在训练不同的基于机器学习的模型时使用独热编码。此外,独热编码将分类变量视为独立变量,而不考虑它们之间的关系。为了保留目的地之间的关系信息,我们使用实体嵌入自动学习多维空间中此类分类特征的表示[29]。4.2.1. 图嵌入近年来出现了一些关于学习图的潜在表示的研究。我们可以使用基于嵌入的模型来学习复杂数据结构(如图)的潜在表示。这些表示将图中的每个节点映射到一个低维空间,从而提供对节点相似性和网络结构的洞察嵌入通过在嵌入空间中将相似的节点放置在一起来捕获输入图的语义这种嵌入可应用于许多问题,从检测蛋白质到蛋白质生物网络中的相互作用到社交网络中的友谊推荐[30]。因此,我们探索的想法,学习这种潜在的代表性用户4.2.2. 目的地旅行图创建我们将目的地城市表示为无向图中的节点为了量化两个节点之间的边的权重因此,我们在用户在同一次旅行中访问的每对城市之间画出一条边例如,如果用户首先访问纽约市到费城,然后访问费城到华盛顿特区,则我们添加从纽约市到华盛顿特区的边我们认为,这种额外的传递连接捕获的基础流动性比省略的信息,用户访问这些目的地在同一次旅行。每条边的最终权重是数据集中所有行程的同一行程中两个节点的同现次数。我们解释了重复,即,如果同一用户在观察期内进行了两次相同的多目的地旅行,则在旅行图中将其计数两次。 为了减少图中的噪声,我们移除权重等于1的所有边,即,只有一个用户在这两个目的地之间旅行。表2目的地旅游图Booking.comTwitter节点数5,0463,523边缘数量88,62362,260密度0.00690.01两个数据集的结果图的一些关键指标列于表2中。Booking.com的节点和边稍微多一些,导致Twitter稍微密集一些;但是,这两个图都非常稀疏。此外,分析图5中描述的度分布,可以看到高度节点相对较少。(a) 预订(b)Twitter图5:目的地旅行图的经验累积分布函数(ECDF)4.2.3. 目的地嵌入目的地嵌入的目标是对图中节点表示的城市进行编码,以便机器学习算法可以预测和发现此类复杂网络中的新模式。因此,找到一种可以有效地为这些网络生成表示的方法至关重要。DeepWalk [31]和Node2Vec [32]等流行方法使用随机游走来生成此类嵌入,这非常适合捕获移动模式。其他深度学习方法,如结构深度网络嵌入[33]和层次注意力网络[34],采用自动编码器和注意力机制,由于我们的任务性质以及可用数据集的大小和特征数量,我们通过使用DeepWalk和Node2Vec进行实验,我们发现这些方法在编码我们在上一节中构建的目的地旅行图这两个软件库都依赖于直接编码将图中的每个节点转换为向量,并使用基于内积的使用随机游走的统计来捕获节点的局部上下文,即,大小为的随机游走尝试模拟SkipGram中使用的窗口大小为的单词的上下文DeepWalk从每个节点开始运行固定长度的无偏随机游走,而Node2Vec使用灵活的有偏随机游走,可以在网络的局部和全局视图之间进行权衡它使用参数Rk来控制步行立即重新访问节点的可能性,而Rk控制步行重新访问节点的一跳邻域的可能性 这个额外的功能使我们选择Node2Vec来学习两个数据集中的低维目标表示。大小为100的固定长度向量表示每个目的地。为了创建一个可视化的概述,我们使用t分布随机邻居嵌入(t-SNE)将学习的Node 2Vec城市嵌入映射到2-D空间[35]。图7中的颜色编码代表国家,尽管由于www.example.com数据集的匿名化Booking.com,我们不知道哪个国家是哪个国家。然而,我们在Twitter数据集中有这些信息如图7b所示,美国和加拿大以及菲律宾和缅甸等国家在嵌入空间上很接近,这表明尽管该算法无法获得这些信息,进一步放大,我们还可以看到嵌入也很好地捕获了城市的相对位置,如图6中荷兰城市的示例所示。4.2.4. 旅行者嵌入上一节定义了一种表示目的地的方法;然而,我们也可以扩展这种嵌入的使用,以个性化对停留时间的预测例如,在自然语言处理,使用词嵌入的加权平均值来创建句子嵌入是相对常见的[36]。类似地,通常通过对节点嵌入进行平均来总结图神经网络中的图的一部分,并将这些嵌入用于稍后的几个下游任务[37]。 我们遵循类似的想法来创建旅行者嵌入,计算用户过去访问过的所有城市的平均嵌入。 平均嵌入可以帮助我们为每个用户个性化推荐停留时间,因为它是他们过去旅行行为的一个特征。图6:使用目的地旅游图生成的荷兰城市嵌入的T-SNE预测5. 实验在本节中,我们将描述如何根据一些统计基线,利用上述不同的嵌入设置来评估各种算法的性能5.1. 评估设置在我们的实验中,我们使用平均绝对误差(MAE)和均方根误差(RMSE)来衡量我们不同方法的性能[38]。这两个指标已被广泛用于评估此类问题的性能 RMSE不使用绝对值,这使得它在许多情况下是可取的,主要是在计算某些模型参数的梯度或灵敏度时。因此,结合这两个指标有助于我们更好地评估性能。预测任务是确定目的地的日历天数,因为这一信息在两个数据集中都可用。 这也意味着所有输出连续值的算法都需要舍入为整数,因为测试集中的持续时间也是整数。在计算评估指标时包含小数位会产生误导[39]。因此,我们还分析了舍入对模型整体性能的影响5.2. 基线方法我们将基于机器学习的方法与四个简单的基线进行了比较。这些方法包括简单的统计测量和Dietz和Wörndl[11]提出的方法的两种变体• 用户平均值:给定用户所有过去行程的持续时间的平均值• 用户模式:给定用户的所有过去行程的持续时间的模式值• 用户百分位数-国家水平:通过将用户的平均百分位数与[ 11 ]中提出的访问同一国家的所有其他旅行者的分位数进行比较,计算用户• 用户百分位数-城市级别:通过将用户的平均百分位数与[ 11 ]中提出的访问同一城市的所有其他旅行者的分位数进行比较,计算用户5.3. 特点变化为了了解哪些功能对推荐停留时间有用,我们评估了三种变体,这些变体将上述高级表示和基本功能作为输入。基本特征包括旅行类型(国内或国际)、用户所在国家/地区和目的地国家/地区。高级特征表示的三种不同变体如下:• Mobility One-Hot Encoded(M-OHE):一种基于机器学习的基线方法,使用预订者和目的地国家的传统One-Hot编码,而不是嵌入。• 移动全球嵌入(M-GE):使用第4.2.3中讨论的城市嵌入,而不是预订者和目的地国家。• 移动个性化嵌入(M-PE):使用城市嵌入以及第4.2.3和第4.2.4分别讨论的旅行者嵌入表3不同评估场景中使用的功能M-OHEM-GEM-PE跳闸类型YYY旅行者类型聚类YYYUser home countryYNN目的地国YNN城市嵌入NYYTraveler嵌入NNY我们在表3中总结了上述方法中使用的特征。我们总是使用行程和旅行者类型作为输入特征,因为它们是方法的基础M-GE和M-PE通过城市嵌入隐式地对原籍国和目的地国进行编码;因此,为了避免冗余,我们不再输入这些信息。5.4. 算法为了评估这些特征和编码的变化,我们使用了scikit-learn5中的决策树和CatBoost6中的梯度提升。CatBoost是一个最先进的开源库5scikit-learn决策树:https://scikit-learn.org/stable/modules/tree.html6CatBoost库:https://catboost.ai对于Yandex开发的决策树上的梯度提升,即使使用默认参数,它也具有与大多数其他梯度提升库相似或更好的性能[40]。我们选择这些算法是为了获得对不同嵌入策略的重要性和成功性的额外分析见解尽管这些基于树的模型已经建立了很长时间,但它们的性能与深度神经网络方法相当,并且更容易调整[41]。为了加快训练过程,我们在Google Cloud Platform7中使用GPU加速学习。最后,我们使用四重交叉验证来解决过拟合问题,并确定每个模型的最佳超参数集,以便使用采用贝叶斯搜索方法的scikit-op-timmizepackagee来获得最佳RMSE值[42]。我们在表4中总结了不同模型的最佳参数。表4最优超参数的确定采用贝叶斯搜索方法的SCIKIT-OP最小化。数据集方法Scikit决策树ITRl2_leaf_reg lr最大深度最大深度最小样本叶最 小样本分割M-OHE1100490.04911493948预订M-GE2100500.02412403948M-PE2100500.23115144581M-OHE1000290.0348445076Twitter M-GE550260.04812493948M-PE1050300.04615244271建议的停留时间是使用不同特征配置的相应算法的机器学习回归模型的结果。5.5. 讨论该评估程序包括两个数据集,四个统计基线,和两个算法,三个编码变量作为自变量。 该设置导致20个实验变化,我们使用四个因变量计算评估。主要目标是衡量不同嵌入之间的差异,从而了解哪些输入特征有用,哪些没有。此外,我们感兴趣的是更多的特征是否会显著改善结果,因为由于准确性的提高越来越少,调整具有更多参数的模型的训练成本可能不值得。最后,我们强调,所有模型的输入完全基于旅行者的移动性。我们可以通过上下文信息和元数据(通常在商业平台上可用)进一步改进真实场景中的嵌入6. 结果我们评估这两个数据集的整体性能。对于Booking.com和Twitter数据集,测试集所有方法的MAE和RMSE值分别见表5和表67谷歌云平台https://cloud.google.com/6.1. Booking.com对于Booking.com数据集,我们可以观察到我们提出的方法在MAE和RMSE方面始终优于基线有趣的是,用户平均持续时间提供了比模式更差的结果,我们将其归因于模式对离群值更鲁棒。回想一下,在目的地停留一天是所有旅行中最常见的此外,当聚合目标在国家层面而不是城市层面时,用户百分位数方法[ 11 ]表现得更好。分析基于嵌入的方法,M-GE和M-PE表现优于M-OHE方法,表明节点嵌入在捕获旅行者与只考虑城市嵌入的M-GE方法相比,M-PE方法中的旅行者嵌入有助于模型更好地理解用户在决策树模型的直接比较中,CatBoost在基于嵌入的编码中表现得比scikit-learn决策树更好,对于one-hot编码具有类似的性能 我们还可以观察到,四舍五入的MAE远低于MAE,而四舍五入的RMSE高于RMSE。因此,对预测值进行四舍五入有助于为大多数用户做出更准确的推荐,除了旅行时间更长的离群用户表5Booking.com的预测误差指标最好的分数是大胆的匕首。方法MaeMAE圆形RMSERMSE舍入用户平均值0.8350.8211.1681.214用户模式0.7420.7421.2331.233用户百分比0.7260.7261.1851.185User百分位数0.7690.7691.2091.21M-OHEScikit-DT 0.678 0.6 0.955 1.016.2. Twitter我们无法在Twitter数据集中复制Booking.com数据集的明确结果首先,数据集似乎更嘈杂,因为毫无例外,所有错误指标都高于Booking.com数据。此外,我们提出的方法仅在RMSE和RMSE舍入方面优于基线,而简单地采用用户停留时间模式的基线方法达到了最低的MAE分数。我们将这一令人惊讶的结果归因于基于入住的数据的特征,而不是酒店预订:如果用户在同一天访问两个或更多城市,每个目的地将被记录为一个日历日的停留时间,即使只有几个小时。这种影响不会发生在Booking.com酒店预订上,因为一个人通常不会为一个人预订两个住宿CatBoost0.6780.6010.9541.01M-GEScikit-DT0.5450.4830.7870.837CatBoost0.5410.4750.7770.827M-PEScikit-DT0.5630.4910.8040.853CatBoost[10] 534[10] 466[10]767[10] 815同一晚除此之外,我们观察到机器学习方法的趋势与Booking.com数据集相似,M-PE的表现优于M-GE和M-OHE。同样,在更异常鲁棒的RMSE度量方面,最好的模型是使用M-PE编码的CatBoost表6Twitter的预测误差指标最好的分数是大胆的匕首。方法MaeMAE圆形RMSERMSE舍入用户平均值0.9620.9581.3071.336用户模式[10]806[10] 8061.491.49用户百分比0.8230.8231.4711.472User百分位数0.8560.8561.4421.443M-OHEScikit-DT 0.932 0.974 1.261 1.2866.3. 讨论我们测试了十种不同的模型,以推荐在目的地停留的最佳时间,并使用两个数据集进行评估我们最相关的结论是,基于这两个数据集的性能,我们可以看到,基于旅行者类型特征和移动模式的更高级表示提高了对旅行者停留时间我们从www.example.com的数据集中获得了明确的结果Booking.com,即更复杂的特征工程工作可以提高预测性能。 我们在表7中通过简短的消融分析进一步证实了这一点,在该分析中,我们重新审视了M-PE模型的各种特征的影响。这些值是使用CatBoost库计算的,并基于单个输入特征的影响。 我们观察到,这两种嵌入类型在预测停留的持续时间中起着重要的作用。在所有功能中,城市嵌入的重要性最高,其次是旅行者嵌入和旅行者集群。行程类型(国内或表7CatBoost M-PE模型中使用的不同特征对Booking.com和Twitter数据集的重要性重要性Booking.comTwitter城市嵌入44.84%46.32%旅行者嵌入百分之二十六点四五44.77%旅行者集群28.60%7.54%跳闸类型百分之零点零九百分之一点三五CatBoost0.9310.9751.2591.283M-GEScikit-DT0.8840.8721.2291.268CatBoost0.8820.8761.2221.262M-PEScikit-DT0.8920.8981.2361.278CatBoost0.8440.820[1] 183[1] 228特征国际)特征在预测中不起作用,因为两个数据集主要由一种旅行类型形成。在Twitter数据的情况下,表6的结果强调了与简单基线相比任务 从图1中可以看出,各个目的地的停留时间分布是负向倾斜的,大约一半的停留时间只有一天。这种情况使得基线很容易表现良好。 虽然这两个数据集大致相同,但www.example.com上的大多数国际酒店预订(95.5%)Booking.com比Twitter用户的大多数国内酒店预订(91.3%)噪音要小得多。 出于这个原因,我们看到两个数据集之间的直接可比性有限,并观察到酒店预订的持续时间更适合预测与所提出的算法比从基于位置的社交网络观察到的无约束的流动性。当涉及到结果的普遍性时,我们强烈怀疑Book-ing.com挑战数据集来自数据科学挑战;它可能太干净了,无法成为推荐个性化逗留时间的挑战的现实基准。Twitter数据集可能更接近现实,这是一个发人深省的见解:由于数据中大多数旅行的实际持续时间恰好是一天,简单地推荐一天的策略-本质上是用户模式方法-可以与机器学习方法竞争。7. 结论在本文中,我们探讨了如何有效地利用旅行者的行为和移动模式来预测在目的地停留的持续时间时,用户的偏好模型。使用两个数据集,一个基于酒店预订,另一个基于基于位置的社交网络的基于入住的旅行者移动性,我们根据统计基线评估了具有域驱动特征工程的机器学习算法。高质量数据的不可用阻碍了特征工程;然而,即使Booking.com数据集是匿名的,我们也可以自动识别不同的目标嵌入因此,据我们所知,我们首先系统地评估目的地推荐的停留时间。给定用于进行特征工程的输入特征,可以看到将我们的方法和实验设置推广到任何基于签入的数据源的潜力在未来,我们计划将这项工作扩展到不仅推荐在一个目的地停留的时间,而且确定复合旅行中所有路段的最佳持续时间[43,9]。此外,我们有兴趣探索嵌入用户移动模式的其他方法的好处,并尝试深度学习以进一步优化预测任务推荐物品消费量不仅与目的地级别相关,而且还可以在更精细的级别上进行分析,例如,确定在特定兴趣点停留多长时间[44]或锻炼活动的持续时间[45]。 我们相信我们的方法可以补充现有的方法,并建立一个评估标准,这个问题。引用[1] Y. 科 伦 河 , 巴 西 - 地 Bell, Advances in collaborative filtering , in : RecommenderSystems Handbook,Springer US,2015,pp. 77-118. doi:10.1007/978-1-4899-7637-6_3。[2] M. F. Dacrema,P. Cremonesi,D.贾纳赫,我们真的取得了很大的进展吗?对最近神经推荐方法的令人担忧的分析,在:第13届ACM推荐系统会议,RecSys'19,ACM , 纽 约 , 纽 约 , 美 国 , 2019 年 , pp.101-109.doi :10.1145/3298689.3347058。[3] A.辛格,T. Joachims,排名中曝光的公平性,在:第24届ACM SIGKDD国际知识发现&数据挖掘会议,KDD '18,计算机械协会,纽约,纽约,美国,2018年,pp。2219-2228. doi:10.1145/3219819。3220088。[4] A. J. 别加湾P. 古马迪湾Weikum,注意力的公平性:在排名中摊销个人405-414doi:10.1145/3209978.3210063。[5] H. Abdollahpouri, G. Adomavicius, R. 伯克, I. 盖伊, D. 詹纳赫 T. 神岛,克拉斯诺德布斯基湖Pizzato,多利益相关者建议:调查和研究方向,用户建模和用户适应性交互30(2020)127-158。doi:10.1007/s11257-019-09256-1。[6] S. 王湖,加-地Hu,Y.王湖,加-地曹湾,加-地Z. 盛,M.Orgun,顺序推荐系统:挑战,进展和前景,在:第28届国际人工智能联合会议,国际人工智能组织联合会议,2019年。doi:10. 24963/ijcai. 2019/883。[7] D. 赫尔佐格湖W. Dietz,W.Wörndl,旅游行程建议Augstein,E. Herder,W.Wörndl(Eds.),个性化人机交互,de Gruyter Oldenbourg,柏林,德国,2019年,pp。159-182. doi:10.1515/9783110552485-006。[8] D.加瓦拉斯角Konstantopoulos,K.马斯塔卡斯湾Pantziou,解决旅游行程设计问题的算法方法调查,启发式20(2014)291-328。doi:10. 1007/s10732-014-9242-5。[9] D. Herzog,W. Wörndl,一个旅行推荐系统,用于将多个旅行地区组合到一个复合旅行中,在:CBRecSys,2014年,第103页。42比48[10] M. 谢湖,加-地诉S. Lakshmanan,P.T. Wood,Composite recommendations:fromitems to package,Frontiers of Computer Science 6(2012)264doi:10.1007/s11704-012-2014-1。[11] L. W. Dietz,W.Wörndl,在哪里呆多久关于旅行建议中的物品消费量,见:ACMRecSys 2019最新结果,2019年,第10页。31比35[12] P. Covington,J.Adams,E.Sargin,用于YouTube推荐的深度神经网络,在:第10届ACM推荐系统会议,RecSys'16,ACM,纽约州纽约市,美国,2016年,pp. 191--198.网址:https://doi.org/10.1145/2959100.2959190。doi:10.1145/2959100。2959190。[13] X. 伊湖,加-地Hong,E.,中国红毛蕨Zhong,N.N. Liu,S.Rajan,Beyond clicks:Dwell time for personalization,in:8th ACM Conference on RecSys '14,ACM,NewYork,NY,USA,2014,pp.113-120.网址:https://doi.org/10.1145/2645710.2645724。doi:10.1145/2645710。2645724。[14] Y. Tian,K.Zhou,等,中国藓类D.Pelleg,What and how long:Prediction of mobileapp engagement,ACM Transactions on Information Systems 40(2022)1-38. 网址:https://doi.org/10.1145/3464301。doi:10.1145/3464301。[15] D. 北山湾Ozu,S.Nakajima,K.Sumiya,A Route Recommender System Based onthe User177比190 doi:10.1007/978-3-319-11265-7_14。[16] L. W. Dietz,数据驱动的目的地推荐系统,在:第26届用户建模,自适应和个性化会议 , UMAP '18 , ACM , 纽 约 , 纽 约 , 美 国 , 2018 年 , pp. 257-260. doi :10.1145/3209219.3213591。[17] D. Goldenberg,P.Levin,Booking.com多目的地旅行数据集,在:第44届国际ACMSIGIR 信 息 检 索 研 究 与 开 发 会 议 , ACM , 纽 约 , 美 国 , 2021 年 。 doi :10.1145/3404835.3463240。[18] J. Melià-Seguí,R. Zhang,E.巴特湾Price,O. Brdiczka,Activity duration analysisfor context-aware services using foursquare check-in,in:International Workshopon Self-aware Inter
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 前端协作项目:发布猜图游戏功能与待修复事项
- Spring框架REST服务开发实践指南
- ALU课设实现基础与高级运算功能
- 深入了解STK:C++音频信号处理综合工具套件
- 华中科技大学电信学院软件无线电实验资料汇总
- CGSN数据解析与集成验证工具集:Python和Shell脚本
- Java实现的远程视频会议系统开发教程
- Change-OEM: 用Java修改Windows OEM信息与Logo
- cmnd:文本到远程API的桥接平台开发
- 解决BIOS刷写错误28:PRR.exe的应用与效果
- 深度学习对抗攻击库:adversarial_robustness_toolbox 1.10.0
- Win7系统CP2102驱动下载与安装指南
- 深入理解Java中的函数式编程技巧
- GY-906 MLX90614ESF传感器模块温度采集应用资料
- Adversarial Robustness Toolbox 1.15.1 工具包安装教程
- GNU Radio的供应商中立SDR开发包:gr-sdr介绍
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功