RETE：基于统一查询产品演化图的检索增强时间事件预测

14 浏览量更新于2023-11-29 收藏 1.32MB PDF 举报

用户行为

商品推荐

身份认证购VIP最低享 7 折!

30元优惠券

462用户对产品的优势产品到属性边产品到产品边缘查询端边缘单搜索查询：计算机搜索查询：监视器你可能想搜索：有乐趣，键盘，游戏匹配匹配hasBrand三星……购买为您推荐合购hasBrand苹果合购时间RETE：基于统一查询产品演化图的检索增强时间事件预测Ruijie Wang1人，Zheng Li2人，Danqing Zhang2人，Qingyu Yin2人，Tong Zhao2人，Bing Yin2人，Tarek Abdelzaher1人1美国伊利诺伊大学香槟分校2Amazon.com Inc，CA，USA{ruijiew2，zaher}@illinois.edu，{amzzhe，danqinz，qingyy，zhaoton，alexbyin}@amazon.com摘要随着对电子商务平台的需求不断增加，大量的用户动作历史正在出现。这些丰富的动作记录对于了解用户的兴趣和意图至关重要目前，用户行为预测的研究主要集中在与产品端信息的交互上。然而，与搜索查询的交互，通常作为用户和产品之间的桥梁，仍在研究中。在本文中，我们探讨了一个新的问题，命名为时间事件预测，广义用户行为预测任务在一个统一的查询产品进化-ary图，包括查询和产品推荐的时间方式。为了实现这一设置，涉及两个挑战：（1）大多数用户的动作数据是稀缺的;（2）用户偏好是动态演变的，并随着时间的推移而变化。为了解决这些问题，我们提出了一种新的检索增强的时间事件（RETE）预测框架。与现有的通过粗略地吸收来自整个图中的连接实体的信息来增强用户表示的方法不同，RETE有效地并且动态地集中在每个用户上检索相关实体作为高质量子图，防止来自包含丰富搜索查询的密集进化图结构的噪声传播同时，RETE自回归累积检索增强的用户表示从每个时间步，捕捉联合查询和产品预测的进化模式在公共基准数据集和四个真实工业数据集上的大量实验证明了所提出的RETE方法的有效性。CCS概念• 信息系统→电子商务;·计算方法学→机器学习。关键词时态事件预测，动态图学习，电子商务部分工作是在亚马逊实习期间完成的;†通讯作者。允许免费制作本作品的全部或部分的数字或硬拷贝，以供个人或课堂使用，前提是制作或分发副本的目的不是为了盈利或商业利益，并且副本的第一页上有本声明和完整的引用。必须尊重作者以外的其他人拥有的本作品组件的版权。允许使用学分进行摘要以其他方式复制、重新发布、在服务器上发布或重新分发到列表，需要事先获得特定许可和/或付费。请求权限请发邮件至permissions@acm.org。WWW©2022版权归所有者/作者所有。授权给ACM的出版权ACM ISBN 978-1-4503-9096-5/22/04。. . 十五块https://doi.org/10.1145/3485447.3511974ACM参考格式：RuijieWang1（1），Zheng Li2（2），Danqing Zhang2（2），Qingyu Yin2（2），Tong Zhao2（2），Bing Yin2（ 2 ）和Tarek Abdelzaher1（1）。2022年RETE：基于统一查询产品演化图的检索增强型在ACM WebConference 2022（WWW '22）的会议记录中，2022年4月25日至29日，虚拟活动，法国里昂。 ACM ，美国纽约州纽约市， 11 页。https://doi.org/10.1145/3485447.35119741介绍在购物网站或平台上，用户键入搜索查询，然后对返回的产品执行各种操作。这样的用户产生与搜索查询和产品两者的许多交互，诸如“键入搜索查询”、“点击产品页面”、“将产品添加到购物车”或“购买产品”。联合建模用户-查询和用户-产品交互对于识别用户偏好和意图以进行合理和可解释的行为预测是必不可少的100万美元图1：电子商务搜索领域的时间事件预测说明。一组与用户、查询、产品和属性之间的时态信息相关联的交互示例方法主要关注产品端交互（蓝线、黄线、绿线），而忽略了我们工作中探索的搜索查询（红线）的潜在影响不幸的是，如图1所示，为了预测用户即时行为，现有的工作仅仅关注产品侧交互（例如，用户到产品[9，14，23，32]，产品到产品[13，17，37]，或产品到属性[4，40，44，52]），但忽略同样重要的搜索查询。这通常会导致不完整和嘈杂的用户配置文件表征，特别是在缺乏足够上下文的冷启动状态具体来说，搜索查询作为人类自然语言中的一种重要信息载体，是连接用户和产品的桥梁一方面，用户利用搜索查询来表达购物意图，这通常是搜索的先决条件。463WWW后续的用户-产品交互。因此，查询可以直接更接近用户另一方面，联合建模查询和产品信息可以带来互惠互利。例如，对于偶然与搜索引擎返回的不完美匹配集中的不相关产品进行交互的用户，可以利用查询信息来去除这些异常行为，反之亦然。为了充分利用产品和查询的共同作用，我们将用户行为预测归纳为一个新的问题环境，称为时态事件预测，其中用户、查询、产品和属性之间的各种时态信息交互构成了一个大规模的统一查询产品演化图。我们的目标是通过预测未来时间的用户事件来动态地捕获用户兴趣对这个时间知识图的依赖性和演变，其中事件预测可以被分解为同时预测潜在的搜索查询和交互产品。实现所提出的设置的挑战是双重的：（1）动作数据稀缺：由于长尾分布[12]，大多数用户的有限动作记录使得难以获得鲁棒的用户表示。为了解决这个问题，先前的工作堆叠多个聚合层[38，40，44]，例如，图神经网络（GNN）[21]，以积累来自其他实体的信息，如产品侧信息[4，44]或类似用户[40]，以增强用户表示。然而，随着传播层数量的增加，邻域大小呈指数级增长，特别是在像我们这样的连接度更高的图中，因为搜索查询量很大。这通常会带来来自不相关和重复实体的大量噪音，使用户表示不加区分（也称为过度平滑）[26，50，54];（2）兴趣演变：用户偏好和意图随着时间的推移而动态演变和转移。随着新的用户活动不断出现并被收集，反映用户最近意图的此类新交互事件可能与先前用户动作事件具有大的分布间隙。未能对这种时变模式进行建模通常会导致随着时间的推移而显着的性能下降[43，53]，特别是对查询和产品的联合目标进行建模。出于这些挑战，我们提出了一个检索增强的时间事件预测框架名为RETE，学习歧视性和时间感知的用户表示联合查询和产品推荐。为了丰富每个用户配置文件，RETE利用子图采样器来动态过滤掉无关的噪声，并从密集和时间图结构中检索集中在每个用户上的高阶实体。这些检索到的实体被组织成子图，并通过结构化注意力模块集成以增强每个用户表示。因此，信息传播被保存在来自高质量子图的局部相关结构内，而不是噪声全局图。为了更好地捕获用户意图随时间的演变，来自每个时间步的检索增强的用户表示的序列经由时间注意模块以自回归方式累积，该时间注意模块可以自动学习在时间轴上分布的用户交互事件的重要性。这使检索增强的用户表示适应于时间感知，以捕获进化模式。为了验证RETE的有效性，我们对公共Yelp Challenge 2019数据集和四个表1：与现有设置的比较。操作历史是指用户过去对产品的各种行为，如“添加”、“点击”和“购买”等。搜索历史是指历史用户搜索查询。Meta数据是指产品侧信息，如属性。性能行动搜索 Meta Temporal Multi历史历史数据信息目的建议基于FM[14、32]✓X X产品✓X X产品✓X X产品顺序/基于会话[11、17、31、36、37]基于KG[4、40、44、52]查询建议[第1、2项]X X X查询✓X X产品✓产品查询动态图学习[9、23]时间事件预测（我们的）真实世界的大规模工业数据集。我们的实验结果证明了RETE在最先进的基线上的优势，包括因子分解机（基于FM）[14，32]，基于会话[17，37]，知识图（基于KG）[4，44]推荐模型以及动态图学习方法[23]。我们进一步进行全面的消融和超参数研究，以验证每个设计选择的有效性。最后，我们通过可视化跨时间步长的时间权重来展示对预测可解释性的见解。总的来说，我们的贡献可归纳如下：问题的制定：据我们所知，我们的工作是第一次尝试提出一个统一的设置命名为时间事件预测，同时考虑查询和面向产品的预测在时间上的方式。新颖的框架：我们提出了一种新的RETE框架，以增强低数据用户的时间事件预测，同时通过从高连接查询产品进化图中动态检索以用户为中心的实体来缓解过度平滑问题。广泛的评估：从经验上讲，在公共数据集和大规模工业数据集上的广泛实验证明了所提出的RETE方法的有效性。2相关工作我们讨论和比较三个相关领域的现有工作，如表1所示。产品推荐。推荐系统（RS）在电子商务平台上取得了巨大的成功。许多努力致力于从不同的角度改进RS：因子分解机（基于FM）模型[14，24，32]有效地考虑了丰富的输入特征，顺序/基于会话的建模模型[11，17，30，31，36，37]分别从长/短时间段捕获用户侧动态，知识图（基于KG）[4，40，44]模型考虑了多关系图中的高阶连接并产生可解释的预测。然而，现有的作品仅仅关注产品端的交互（例如，用户到产品[9，14，23，32]，产品到产品[13，17，37]，或product-to-attribute[4，40，44，52]），但忽略了同样重要的搜索查询。我们研究了一个更通用的时间事件预测任务，以共同优化产品和查询预测的进化知识。几种基于知识图的交互式推荐算法优化推荐顺序策略···RETE：基于统一查询产品演化图的检索增强时间事件预测WWW464#···一∈.（）h=厄（）下一页（）下一页NRGRp ∈P。 S pecificall y，GP={（e，r，e′）|e∈P，e′∈IQ，r∈一4方法论短时间内的产品[55]。相比之下，我们专注于研究如何更好地整合进化知识图中的时间感知信息，并排除不相关的噪声，以提高产品预测和查询预测的长期性能。进化图$&2016年10月22日，1998年，交互图$产品查询建议。查询建议任务旨在帮助用户在各种搜索引擎系统中更好地表达自己的意图。&2 1999年，图CUP一般查询建议任务包括三个不同的目标：用户产品查询属性查询重写（QR）[6，16]，查询自动完成（QAC）[27，28]#P[1][2][3][4]。 QR和QAC侧重于对查询进行改进，以帮助用户找到更好的当前搜索意图的搜索结果，而我们专门研究查询预测，“推荐”可能匹配用户意图的查询。利用搜索相互作用与关系图2：第t次查询产品进化图为了捕捉用户行为的时间模式，我们将时间段划分为离散的时间步长t=1， 2，.，T。在每个时间步内，为了便于讨论，我们统一了动态交互日志数据[1]、查询依赖关系图[8]或交互历史图Gt和产品图G作为进化的快照用户[2]。相反，据我们所知，我们是第一个提出和研究联合产品和查询预测任务的电子商务。最近成功地将两者结合起来，一知识图谱：Gt=Gt？PGP，如图2所示。查询和文档的联合信息检索在搜索引擎系统[3]，我们主要集中在探索双方的查询和产品的共同一个主要的区别是，我们只考虑结构化图数据，而不是内容，因为查询内容在电子商务上更加私密和敏感。动态图学习。图学习方法[10，19，21，29、47、49]已广泛探讨建议[15、44]，用户建模[35，39，42，46，48]等。最近，提出了动态算法来更好地捕获演化图的时间模式[10，20，23，33，41]。随着构造的查询产品演化图的多样性和复杂性的增加，在处理过平滑问题的同时，如何捕捉时态行为模式也带来了新的因此，我们的目标是设计一个动态模型与子图采样器，以更好地学习信息和时间感知的用户表示。虽然已有的工作已经探索了子图采样器的组合能力3.2定义定义3.1（时间事件预测）。给定一个进化知识图G={G1，G2，···，GT}，对于每个用户u∈ U，时态事件预测的目标是预测T之后可能交互的查询q∈ Q和产品p∈ P.3.3分析在进化知识图上，可以通过整合来自连接实体的来捕获用户意图[52]。现有的基于KG的框架[4，40，44]将实体映射到低维空间中，使得用户，查询或产品之间的相关性可以通过相应的表示来建模，即，hu，hp，hqRd。他们提出了在整个KG的各种传播机制[ 21，38 ]，以便为每个用户整合丰富的信息，通常可以描述如下：利用静态和齐次/二分图上的图神经网络[26，51]，我们进一步促进了进化知识图上的子图采样器Lue′∈Nuπ（u，r，e′）h（l−1），（1）3序言和分析3.1概念和符号我们研究了以查询为中心的事件和以产品为中心的事件与时间信息相关联，即，用户U在时间t键入搜索查询Q或对产品P执行动作。一组构成动态交互图Gt=其中，u表示用户u的邻居集合，l表示用户的数目，在传播层中，三元组u，r，e'描述u和e'之间的交互，并且πu，r，e'表示聚合权重。将这一系列传播机制直接推广到事件预测任务，特别是在进化知识图上，面临两个问题：（i）随着l的增长以整合高阶信息，邻域大小呈指数级增长。大比例的不相关实体（噪音）被整合，使用户代表-彼此区别不大，甚至导致{（e，r，e ′，t）|e ∈ U，e ′ ∈ Q？ P，r ∈ RA}，其中U，Q和P表示过度平滑[26，50，54];（ii）进化知识图随着用户意图的演变，用户集、查询集和产品集。关系集合A表示它们之间的交互类型，如“键入查询”、“点击产品”、“将产品添加到购物车”等。同时，丰富的产品元数据构成了一个异构的产品属性图GP，描述了产品的重要属性s？每个R}I和行为模式。忽略这些时间因素不仅无法捕获最新的数据特征，而且还解决了由于集成大比例的过时记录用于学习表示而引起的第一个问题。P，其中表示产品的属性集，包括但不包括仅限于品牌、产品类型和类别。P表示它们之间的关系集P还描述了产品和查询之间的匹配关系在本节中，我们将介绍拟议的RETE框架。我们本文首先对远程教育技术进行了概述，然后详细介绍了远程教育技术的三个主要组成部分。最后，我们描述了模型的优化。22012年10月22WWWwang等人465：：G]ℎ62时间感知16美元…T31用户T31+1代表+11T+1+13时间注意力1112222000吨莱特产品展示32011年12月22日查询结果结构性注意+1+1+1检索增强代表TransRK子图采样器PPR取样器111222$$112122联系我们…��111222$$交互图电子邮件积图用户产品查询属性K-hop采样器12$1200日元1 2$<航空航天工业中的国际合作进化图��…进化图2进化图电子邮件关系<中的2012年12月12时间图3：拟议RETE模型的框架我们交替使用自回归排序损失和知识图完成损失（transR）来优化RETE模型4.1概述为了同时解决第3.3节中提到的两个问题，拟议的RETE努力满足以下要求：要求1：它应该通过考虑高阶信息并从图中过滤掉大比例的噪声来学习信息丰富和有区别的需求2：它应该从不同时间步的数据中捕获用户意图演变，以便产生最新的预测。RETE的框架如图3所示。基于收集的进化知识图，RETE的核心思想是在每个时间步从采样的子图而不是整个图中学习信息丰富的用户表示，并通过可学习的时间权重将它们组合在一起以捕获用户意图演化。RETE首先利用子图采样器来集中检索围绕每个用户u的相关实体。然后通过结构注意模块将子图中丰富的信息整合起来。通过时间注意力模块将来自所有时间步的一系列学习表示进行整合它可以自动学习时间域中的组合权重，使得更相关（例如，更近的）时间步长被分配更大的权重，并且不相关的（例如，远）时间步长被分配较小的权重（但不一定为0，因为它们也可以反映长期意图）。为了满足要求1，采样子图将注意信息传播限制在局部高度相关结构内，从齐次图相关节点[7，22，51]。并进一步将其与一个简单的随机k-hop采样器集成，以更全面地检索实体这种设计的优点，而不是利用可训练的策略，是它不需要可靠的输入特征（与[26]不同，它是完全独立的特征），并且它实现了更高的样本效率（几乎是实时的，小心实现，如附录A.3所示）。我们将设计的采样器总结如下：PPR 采样器。我们使用与特征无关的个性化 PageRank（PPR）值。给定一个目标用户u，我们的PPR采样器首先计算所有其他实体的近似PPR值，然后选择阈值θ以上的最多b个邻域，并保留所选实体集之间的关系。k-hop采样器。从目标用户u开始，k跳采样器遍历多达k跳连接并随机选择多达b个邻居.包埋取样器。为了捕捉用户意图的全貌，我们集成了不同类型或不同参数的多个采样器来对多个子图进行重复采样。4.3结构注意力模块不失一般性，让s表示来自集合采样器的子图的数量在时间步长t处，给定采样的子图{G1t，···，Gst}，对于每个用户u，结构注意力真正的，而不是整个图，以便考虑高阶[u][u]信息，过滤噪音。时态模块的设计使我们能够自动回归地学习用户的最新表示，关于RETE如何满足两个要求的理论分析，我们请读者参阅附录A.1接下来，我们将分别介绍子图采样器、结构注意力模块和时间注意力模块。4.2 包围子图取样器建议的采样器的目的是检索不同的和相关的实体，通过高阶连接，并排除无关的噪音，秩序的增加。为这种可取的做法设计强有力的指标，模块旨在整合所有有用的信息，以了解用户表示。如图4所示，它首先通过多层图注意力从每个子图中提取信息[38]。然后将来自不同视角的信息融合在一起，将来自不同子图的输出融合在一起，以捕获用户意图的全局图像。具体来说，我们首先利用L图注意层传播和整合每个子图ST内的信息。每一层可以用Eq.2：[u子图，我们采用结构相关的个性化PageRankh（l）=σlI.α（l）W（l）h（l−1）\l，（1≤l≤L）（2）V(PPR)[18]这是一个最近被证明有效的检索u uv v Zv∈Nul·····RETE：基于统一查询产品演化图的检索增强时间事件预测WWW466（（：��1（《古兰经》9：1）（（（（）1W&（（）W（（）101W6一（（）（（）101W6W 7…（（）W七（（）101W6（（）（（）��W6 W71W7L关注层（（）L层注意布吕u[客户端]..~t（·）~=h，h>q乌乌格起up+∈Eup+起~LLLLT+1~.uWQhuWKhv′并且σ是非线性激活函数。由于信息传播被限制在采样的=~ht，hp>和γtu不uup+等级（p+）上-.从静态产品图表示产品和查询信息哪里ESt[u] 表示设置在k=1βij=softmax. HW Q（HWK）T+MI j、（7）其中，W Q、W L、W V是可训练的时间参数，βij是学习的时间权重，d表示用户表示的维度，并且添加M以确保自回归设置，即，防止─影响当前状态的未来信息。我们定义i≤ j，否则为−∞。Mij= 0如果图4：子图上的结构注意力模块其中h（l）表示来自层l的用户表示，应用Eq.6，我们不仅能够强调与用户在h T中表示的短期意图相关的那些信息，而且还能够在我们整合来自所有时间步的所提出的时间模块提供了更好的可解释性，其中时间注意力权重反映了用户意图的演变和转移。值得注意的是，它可以自动回归应用从T+2，T+ 3，···新收集的数据，因为它自动ust（l）计算未来时间步长中的时间组合权重子图Gu上用户u周围的邻居集，αuv是聚合注意力权重，如以下等式所示无需模型修改或重新训练。exp..T.一（l）（l）（l）（l）。ΣΣ4.5优化（l）WQhuWKhvv′∈Nuexp 一 σ.ΣΣ拟议框架预计将反映αuv =.T（l）（l）（l）（l）、（3）从进化知识图谱中提取用户偏好更好地其中W（1）、W（1）、W（1）是应用的共享加权变换同样的低维空间，我们利用知识图谱V K Q嵌入模块transR [25]来优化知识图谱com-对于子图中的每个实体，a是一个权向量，作为前馈层实现的注意力功能，损耗LKGC，详见附录A.2。学习后-在时间步t处使用用户/产品/查询表示，即，h，hp，子图，可以堆叠更多的注意力层，以更好地学习潜在表示，而不会引入其他不相关的实体和噪声。然后，我们使用跨L层的剩余连接，to model模型relevance相关性.我们使用负采样来加速和稳定训练过程。在时间t，对于每个用户-产品对（u，p+），我们随机图级池，以更好地集成信息采样几个负样本（u，p−），其中我们期望γt−时间步t处意图：hst=1[u]. .h（l）、（4）比γt小一点因此，我们采用加权近似秩成对（WARP）损失[45]用于产品预测，如下所示：u|Est|×LueStL[u].T.L（rank（p+））·|λm−γt+γt |+St[u]E（u，p+）∈Gt，（8）t=1 . 通过这样做Lp=我们能够从子图中整合所有有用的信息更好地代表用户。为了进一步捕捉用户的全局视图-其中Reλm表示余量值，|·|+表示max（0，·）。为每个帐篷，合奏采样器采样几个子图。从学习观察到的交互（u，p+），我们期望相关性得分γt这些子图的表示，我们利用单层MLP来be比任何一个非线性样本的大λm，即. 例如， |λm−γ t++综合全球信息：γt|+=0。其他人都是，我们都是。使每对（p+，p-）成为t..1吨 2吨圣Σ上-不正确的排名。L（K）=K1/k，秩（p+）表示相对hu = σW hu<$h u<$··<$hu。（五）- 在负样本p-中对正样本p+进行排序，以及L（rank（p+））是惩罚权重。同样，我们可以定义WARP4.4时间注意力模块给定学习到的用户表示H={h1，h2，···，hT}，查询预测的损失为Lq。因此，总体目标是：L=Lp+Lq+LKGC+Δθ2，（9）u乌乌T+1在所有的时间步长中，我们推断用户 hu，用于时间事件预测。我们提出了一个时间注意力模块，通过在h t之间分配不同的权重来自动捕获长期和短期意图。更新其中，Θ表示模型参数，KGC表示TransR损失，以表示乘积图中的静态事实采用小批量Adam算法交替优化KGC和p + q + Θ 2。我们总结了算法1中RETE的优化过程。最新用户表示的函数如下：u可以表示为5实验T+1hu=不t=1βtThtWV 、（六）9子图2子图1第九章（（）9（（：1）ℎ9残差连接第九章1W（（）&11W6（（）.....池化............W （（..1W（（对6.....W （（L层注意起Ghq，我们使用内积γt-th子图Sp−ΣσRETE：基于统一查询产品演化图的检索增强时间事件预测WWW467我们在一个公共和四个真实世界的电子商务数据集上评估RETE，我们的目标是回答以下研究问题：WWWwang等人468~T+1输出：用户意图和模型参数Θ。GL~H∼算法1：RETE的优化过程。输入：进化知识图{G1，···，GT}和产品图GP。H1.围圈采样器为用户采样子图2当模型不收敛时，3产品图优化：4最小化KGC并更新实体表示，P;5在进化图上优化：6对于训练期间的每个时间步tT，<7（自回归训练：）8.根据等式2学习用户意图{h1，···，ht-1}5;9.根据等式（1）更新新意图ht6;10计算时间步t的排序损失Lt和Lt;系统地研究最优分割方法是我们今后的工作。附录A.4中的表5总结了实验数据集的统计数据。5.1.2指标. 我们评估时间事件预测任务中的检索设置，即，我们将预测的产品/查询的前K排名列表与测试时间步长中的地面实况进行我们采用了两个广泛使用的评估协议：Recall@K和NDCG@K。默认情况下，我们设置K=20。5.1.3基线。我们比较以下领域的基线：基于FM的推荐，它考虑了二阶特征的相互作用。我们比较FM[32]和NFM [14]。顺序推荐，考虑用户随时间推移而不断发展的兴趣。我们比较GRU4Rec[17]和BERT4Rec[37]。基于KG的推荐，对异构环境进行tities和高阶连接的建议。我们p q11端部[44]与[45]的比较。12优化等式中的排名损失Lp和Lq8;13端部14根据等式更新用户意图~T+16;RQ1：与学术界和工业界最先进的数据集模型• RQ2：不同组件如何影响RETE性能？• RQ3：RETE能否更好地整合来自邻居的信息• RQ4：RETE能否捕捉用户偏好的演变5.1实验装置5.1.1数据集。我们收集了一个公共Yelp数据集和四个独立的电子商务数据集用于实验：Yelp。 Yelp Challenge 2019 1采用了该数据集，其中包含用户与餐馆和酒吧等企业之间的交互记录。为了便于评估，我们提取了自2014年4月以来的数据，时间跨度超过7年。我们通过从用户评论中提取具有代表性的关键词来生成伪查询。我们会删除交互少于20次的用户、产品和查询。为了构造产品图，我们使用类别，位置等属性电商我们可以访问140天的搜索日志数据和产品属性数据。我们首先收集四个特定类别的数据：电子，书籍，音乐和美容。对于每个类别，我们保留至少10次交互的用户，产品和查询在构造产品图时，我们保留了产品的属性，包括品牌、产品类型等。我们有目的地选择这两个平台，因为不同的时间范围的长度。为了评估我们的框架，我们根据交互时间戳将时间跨度划分为28个时间步。我们将它们分为background/training/val/test（10/10/2/6）来分别训练初始实体嵌入（模型输入）、训练、验证和测试RETE。我们还尝试了不同的时间分割策略，我们的方法始终优于其他方法。我们离开1https：//www.yelp.com/dataset/动态图学习：对进化交互图进行。我们比较乔迪[23]。详细信息可参见附录A.4，包括数据收集、数据统计、基线/模型设置、超参数调整等。5.2模型性能（RQ 1）5.2.1总体业绩。我们首先将产品预测和查询预测的整体性能与选定的基线进行比较，如表2a和表2b所示。在大多数情况下，基于FM（FM、NFM）和顺序推荐（BERT4Rec、GRU4Rec）的方法产生差的结果，因为它们没有明确地考虑高阶交互。RETE在所有指标上都击败了基于KG的方法（KGAT，ECFKG）和动态图学习方法（JODIE），因为我们提出了一种更好的方法来以时间的方式集成多关系数据。值得注意的是，在电子商务平台上，查询预测的性能比预测产品差，而Yelp平台表现出不同的模式。我们假设这是因为电子商务平台上的用户的真实查询比从Yelp评论数据中提取的伪查询更多样化此外，在Yelp平台上更难产生准确的预测，因为Yelp数据是从更长的时间段收集的，其中跨时间步的用户意图转移和演变更难捕获。5.2.2详细性能。此外，为了研究RETE如何随着时间的推移而执行，我们比较了每个测试时间步（6个时间步）中的详细性能，如图5所示。在不同的时间步长中的性能变化很大，表明用户意图正在演变和转变。 RETE在几乎所有的时间步上都优于其他算法，最后几个时间步的改进更为显著，说明我们提出的时态模型能够捕捉用户偏好的演变，从而获得更好的长期性能。5.2.3自回归评估。随着用户与电子商务平台的不断交互，新的交互事件被不断收集。在实际场景中，需要部署的模型可以采用新收集的数据来更新用户表示，而无需耗时的重新训练或微调。将其引入自回归估计，并验证了RETE在自回归估计下的鲁棒性由于很难在没有重新训练的情况下根据新数据更新静态模型·······RETE：基于统一查询产品演化图的检索增强时间事件预测WWW469∗任务产品预测表2：产品和查询预测的总体性能报告5次独立运行的平均结果表示相对于最佳基线的统计学显著改善，p值小于0。001.数据集公共工业电子商务Yelp电子音乐图书美容K=20NDCG@K召回@KNDCG@K召回@KNDCG@K召回@KNDCG@K召回@KNDCG@K召回@K基于FM的顺序推荐基于动态图学习KG的推荐（a）产品预测业绩。数据集公共工业电子商务Yelp电子音乐图书美容K=20NDCG@K召回@KNDCG@K召回@KNDCG@K召回@KNDCG@K召回@KNDCG@K召回@K基于FM的顺序推荐基于动态图学习KG的推荐(b)查询预测性能。表3：自回归评估下的性能。报告了六个测试时间步长的平均结果(a) 产品（b）询问。图5：电子产品每个测试周期的回忆@20，最后几个时间步长的显著改进。主要是与动态模型（BERT4Rec、GRU4Rec和JODIE）进行比较给定新的测试数据，我们不断地将它们馈送到时间模块中，并在下一个时间步中评估表3报告了测试时间步长的平均性能所有比较的模型在考虑新收集的数据后都取得了改进的结果，因为这些数据包含了更多的最新线索来捕捉用户RETE可以实现最佳性能，表现出更好的泛化能力和持续学习的鲁棒性。FM0.02210.02770.05120.07130.06410.09810.06820.09640.11550.1459NFM0.02140.02810.07150.11640.07610.10050.07930.10640.12460.1591BERT4Rec0.04220.05010.06190.08320.05370.06180.04470.06510.08270.1015GRU4Rec0.04190.05110.07420.08590.06210.07110.04120.06580.08420.1003Jodie0.04590.05270.13990.15150.11230.14050.14010.18810.14580.1807KGAT0.03420.04030.15030.19140.11560.13010.12540.14790.15030.1893ECFKG0.03880.04950.14130.18590.10360.12460.13270.16740.14010.1799RETE（我们的）0.0499*0.0589*0.1703*0.21200.1304*0.15210.1455*0.1976*0.16210.1985*增益8.71%11.76%百分之十三点三一百分之十点七六百分之十二点八8.27%3.85%5.05%7.85%4.86%FM0.02570.03190.04810.07650.03240.06810.08620.10150.06140.0854NFM0.02440.03310.05330.07090.05830.11880.08510.11030.06730.0903BERT4Rec0.04070.04980.06020.08770.02070.04570.04130.08820.04170.0566GRU4Rec0.03810.04770.05900.07310.04360.05990.04010.09070.05130.0602Jodie0.04610.06170.07790.09570.09880.13640.13010.14750.13270.1495KGAT0.04310.05270.09130.11530.08230.13240.12930.14970.12990.1502ECFKG0.03970.04810.08990.10990.08970.12590.12830.15030.12140.1518RETE（我们的）0.0507*0.0653*0.1015*0.1393*0.1033*0.1408*0.13910.1557*0.14870.1643*增益百分之九点九八5.83%百分之十一点一七百分之二十点八二4.55%3.22%6.92%4.01%百分之十二点零六百分之九点三一数据集电子音乐K = 20NDCG@K召回@KNDCG@K召回@KBERT4Rec0.08300.12320.05660.07010.05190.0803GRU4Rec0.10990.12010.13710.1507Jodie0.18010.1962我们0.19610.24140.15610.1733任务查询预测数据集电子音乐K = 20NDCG@K召回@KNDCG@K召回@KBERT4Rec0.08610.10190.04550.06340.05010.0633GRU4Rec0.06610.09130.12030.1499Jodie0.12590.1526我们0.14250.17930.13520.1631WWWwang等人470∼表4：Recall@20评价的消融研究。数据集电子音乐消融产品查询产品查询关于如何构建输入图的变体：无属性0.16860.10370.11540.11320.1335-无查询0.1749--0.0943无产品-0.0973子图采样器上的变体：唯一的k-hop采样器0.19910.12030.13630.13670.15010.1399仅PPR采样器0.21230.1381静态与动态：我们的（静态）0.19310.11830.12990.1327我们0.21200.13930.15210.14085.3消融研究（RQ 2）为了研究每个组件如何影响模型性能，我们进行了以下消融研究，如表4所示5.3.1各种信息的影响。我们的解决方案构造了一个时态KG来组织多关系数据，以进行联合产品和查询预测。正如预期的那样，删除富属性会导致性能下降，因为它们提供了产品和查询之间的可靠关系。此外，我们可以通过分别删除产品实体和查询实体后的性能下降来证明联合查询和产品预测任务的共同利益。有趣的是，删除产品会显著影响查询预测性能。这是因为查询主要通过产品节点连接，并且在此消融中忽略了很大比例的查询连接。5.3.2系综子图采样器的效果：我们提出了一个集成子图采样器检索相关的实体和过滤无关的噪音从整个图。不同的采样器可以从不同的角度捕捉数据特征。仅使用k-hop采样器或PPR采样器可能会损害将它们集成在一起的性能兼容性 PPR采样器的性能优于k-hop采样器，因为当原始邻居信息时，PPR值可以更好地反映实体之间的相关性。5.3.3时间模块的影响为了评估时间注意力模块的影响，我们比较了静态变体的性能。我们的动态模型可以比静态模型有10%的5.4集合采样器（RQ3）分析我们分析了我们的集成子图采样器如何通过收集相关的高阶实体和过滤掉大比例的噪声来改善检索结果如图6a所示，与KGAT不同，RETE通过堆叠更多的层来提高性能（默认情况下，我们选择3.为了调查检索到的实体的质量，图6b示出了实体类型之间的分布以及检索到的实体的平均数量。 RETE可以通过检索合理数量的实体来整合多样化和平衡的信息。相比之下，具有3层的KGAT为每个用户集成了来自9000多个实体的噪声信息，其中超过96。4%的集成实体是产品。(a)#of layers的效果。（b）实体类型分布。图6：检索分析。RETE通过堆叠更多的层来提高性能，并且可以通过合理数量的检索实体来检索更平衡的信息。图7：时间注意力的案例研究。在预测t = 10时的新事件时，它更多地强调相关事件，而不是无关事件。在每个时间步，我们报告并总结最常见的事件。5.5时间分析和案例研究（RQ4）为了研究用户偏好的演变以及RETE如何捕获它，我们从具有76个事件记录的Electronics数据集中选择了一个用户如图7所示，从每个时间步中最频繁的事件中，我们可以观察到从移动平板电脑相关项目到Nintendo Switch相关项目的明显兴趣转移。星前权重用于自回归预测。时间模块可以在新的时间步长上更多地强调相关事件，而更少地强调不相关事件。6结论在本文中，我们探讨了时间事件预测，一个新的问题，考虑时间的影响，从查询和产品的用户行为。为了增强大多数用户的稀疏动作信息，同时捕获用户意图的演变，我们提出了一种新的RETE框架，以有效地检索相似的实体作为子图，以丰富用户配置文件表示，然后自回归适应它是时间感知的。我们评估建议的RETE方法对以产品为中心和以查询为中心的事件预测任务。在公共数据集和工业数据集上的大量实验定性和定量地证明了该方法的有效性。RETE：基于统一查询产品演化图的检索增强时间事件预测W

下载后可阅读完整内容，剩余1页未读，立即下载