没有合适的资源?快使用搜索试试~ 我知道了~
878基于知识图的推荐交互背后的学习意图XiangWang新加坡国立大学xiangwang@u.nus.edu盐城苑香港理工大学yanchengyuanmath@gmail.com摘要黄婷琳浙江大学tinglin.zju.edu.cn刘振光浙江大学liuzhenguang2008@gmail.com蔡达成新加坡国立大学dcscts@nus.edu.sg关键词DinggxianWangdiwang@ebay.com伟河南省中国科学技术大学xiangnanhe@gmail.com知识图在推荐系统中扮演着越来越重要的角色。最近的技术趋势是开发基于图神经网络(GNN)的端到端模型然而,现有的基于GNN的模型在关系建模中是粗粒度的,未能(1)在细粒度的意图级别识别用户-项目关系,以及(2)利用关系依赖性来保留长距离连接的语义。在这项研究中,我们通过使用辅助项目知识来探索用户-项目交互背后的意图,并提出了一个新的模型,基于知识图的意图网络(KGIN)。从技术上讲,我们将每个意图建模为KG关系的精心组合,鼓励不同意图的独立性,以获得更好的模型能力和可解释性。此外,我们设计了一种新的GNN信息聚合方案,它递归地整合了长距离连接的关系序列(即,关系路径)。该方案允许我们提取有关用户意图的有用信息,并将其编码为用户和项目的表示在三个基准数据集上的实验结果表明,KGIN比KGAT [41],KGNN-LS [38]和CKAN [47]等最先进的方法实现了显着的改进。进一步的分析表明,KGIN通过识别有影响力的意图和关系路径,为预测提供了可解释的解释。这些实现可以在https://github.com/huangtinglin/Knowledge_Graph_based_Intent_Network上找到。CCS概念• 信息系统→推荐系统。非 营 利 组 织 的作者贡献了质量。†何向南为通讯作者。本文在知识共享署名4.0国际(CC-BY 4.0)许可下发布作者保留在其个人和公司网站上以适当的署名传播作品的权利WWW©2021 IW 3C 2(国际万维网大会委员会),在知识共享CC-BY 4.0许可下发布。ACM ISBN 978-1-4503-8312-7/21/04。https://doi.org/10.1145/3442381.3450133推荐,知识图,图神经网络ACM参考格式:XiangWang , Tinglin Huang , Dingxian Wang , Yancheng Yuan ,Zhengguang Liu,Xiangnan He,Tat-Seng Chua. 2021年与知识图交互背后的学习意图。在网络会议2021(WWW '21)的会议记录,2021年4月19日至23日,斯洛文尼亚卢布尔雅那。ACM,美国纽约州纽约市,10页。https://doi.org/10.1145/3442381.34501331介绍知识图在提高推荐的准确性和可解释性方面显示出巨大的潜力KG中丰富的实体和关系信息可以补充用户和项目之间的关系 它们不仅揭示了项目之间的各种相关性(例如, 由人共同指导),而且还可以用于解释用户偏好(例如, 将用户对电影的选择归因于其导演)。从这些结构化知识中学习高质量的用户和项目表示已成为知识感知推荐的主题。早期的作品[1,4,51]从KG三元组生成嵌入,并将其视为先验或内容信息来补充项目表示。一些后续研究[15,44,49]丰富了从用户到项目的多跳路径的交互,以更好地表征用户-项目关系。然而,这些方法很难获得高质量的路径,遭受各种问题,如劳动密集型特征工程[44],到不同域的可移植性差[15,17]和/或性能不稳定[49]。最近,技术趋势[38,39,41,47]是开发基于图神经网络(GNN)的端到端模型[9,13,19,34]。其关键思想是利用信息聚合方案,它可以有效地将多跳邻居集成到表示中。这些基于GNN的模型将连通性建模和表示学习相结合,取得了良好的推荐性能。尽管他们的有效性,我们认为,目前基于GNN的方法在建模两个因素不足:(1)用户意图。据我们所知,这些研究中没有一个在更细粒度的意图级别上考虑用户-项目关系一个重要的事实879������ (,)������������中文(简体)���������(������,������)������ (一)���������中文(简体)������ (,)���������������(���,)������������(,)������������中国(China)()下一页()下一页--关于我们R()下一页V()下一页()下一页()下一页OG一、G{()|∈ V∈R}IO{( )|∈ U∈ I}UWWW'21,2021年4月19日至23日,卢布尔雅那,斯洛文尼亚Wangetal.用户相互作用������用户意图������:[������,������]������:[������,������]:[���������������项目������������������������������������������……������KG关系���导演:director中文(简体)(,,)���������KG Entities公司简介������������������������合作伙伴������电影系列图1:用户意图采用项目的示例(即,细粒度偏好),其中箭头是从头部实体到尾部实体的关系。最好用彩色看基于节点 邻域聚合���������������,关系路径 邻域聚合已经被忽略了:用户通常有多个意图,驱使用户消费不同的物品。以图1的右侧为例,意图p1强调导演(r1)和明星(r2)方面的组合,其驱动用户u1观看电影i1和i5;而另一意图p2突出明星(r2)和合作伙伴r3方面,以使用户选择电影i2。忽略用户意图的存在限制了用户-项交互的建模(2)关系路径。在这些研究中,信息聚合方案大多是基于节点的,即从邻近节点收集信息不区分它来自哪条路径此外,KG关系通常在相邻矩阵的衰减因子[38,41]中建模,以控制邻居的影响。 如图2的左侧所示,u1的表示混合来自一跳、两跳和三跳邻居的信号(即,i1,i2,v1,v2,v3,v3)。 它不能保持路径所携带的关系依赖性和顺序(例如,从 V3 到 U1 的 三 跳 路 径 中 的 P1、 R2、R3)。因此,这种基于节点的方案不足以捕捉关系之间的相互作用。本文利用项目KG挖掘用户与项目交互背后的用户意图,以提高推荐的性能和可解释性。 我们提出了一个新的模型,基于知识图的意图网络(KGIN),它由两个组件组成,以相应地解决上述限制:(1) 用户意图建模。每个用户-项目交互都是丰富的与潜在的意图。虽然我们可以将这些意图表达为潜在向量,但它们的语义是不透明的,难以理解。因此,我们将每个意图与KG关系上的分布相关联,说明了关系组合的重要性从技术上讲,意图嵌入是关系嵌入的一种注意力组合,其中重要的关系被赋予更大的归因分数。此外,引入独立性约束,以鼓励意图之间的显著差异,从而获得更好的可解释性。(2)关系路径感知聚合。与基于节点的聚合机制不同,我们将关系路径视为一个信息通道,并将每个通道嵌入到表示向量中。由于用户-意图-项目三元组和KG三元组是异构的,因此我们对这两个部分设置了不同的聚合策略,分别提取出用户的行为模式和简而言之,这种关系建模允许我们识别有影响力的意图,并将关系依赖性和路径语义编码到表示中。我们在三个真实世界的数据集上进行了广泛的实验。实验结果表明,KGIN算法的性能优于KGAT[41]、KGNN-LS [38]和CKAN [47]等现有算法。图2:基于节点和关系路径感知聚合方案的示例,其中(虚线或实线)箭头是节点之间的信息流最好用彩色看此外,KGIN还能够以意图的粒度来解释用户行为。我们总结这项工作的贡献为:在基于KG的推荐中揭示交互背后的用户意图,以提高模型的容量和可解释性;提出一种新的模型KGIN,该模型在GNN范式下以更细的意图粒度和关系路径的长程语义考虑用户-项目关系;在三个基准数据集上进行实证研究,以证明KGIN的优越性。2问题公式化我们首先介绍了结构化数据:用户-项目交互和知识图,然后制定我们的任务。交互数据。在这里,我们关注推荐中的隐式反馈[26],其中用户提供的关于其偏好的信号是隐式的(例如,查看、点击、购买)。设为一组用户,一组物品。让+=+u,i u我可以是一组观察到的反馈,其中每个u,i对指示用户u之前已经与项目i交互在之前的一些作品中,如KGAT [41],引入了一个额外的关系interact-with来显式地呈现用户-项目关系,并将u,i对转换为u,interact-with,i三元组。因此,用户-物品交互可以与KG无缝地组合。知识图谱。KG以异构图或异构信息网络的形式存储现实世界事实的结构化信息,例如物品属性、分类或外部常识知识[28,29]。设是真实世界实体的集合,并且是关系集合,其涉及规范和逆方向上的关系(例如,导演和导演)。让 = h,r,t h,t,r可以是三元组的集合,其中每个h、r、t三元组指示存在从头实体h到尾实体t的关系r。例如,(马丁·弗里曼,明星,霍比特人I)描述马丁·弗里曼是电影霍比特人I的明星。通过项和KG实体之间的映射(),KG能够分析项并为交互数据提供补充信息任务描述。给定交互数据+和KG,我们的知识感知推荐任务是学习一个函数,该函数可以预测用户采用某个项目的可能性������用户意图������������……������������������������不......不好���������������������������������������������������������������������������������������=���������������=������=���···880.p( ){()|∈ P}|P |P(·).’:dCov(e,e′)pp.∈PppdVar(ep)·dVar(ep′)与知识图谱2021年4月19日至23日3方法我们现在提出了基于知识图的意图网络(KGIN)。图3显示了KGIN的工作流程。它由两个关键部分组成:(1)用户意图建模,它使用多个潜在意图来描述用户-项目关系,并将每个意图制定为KG关系的精心组合同时鼓励不同的意图彼此独立;(2)关系路径感知聚合,它突出了远程连接中的关系依赖,以保持关系路径的整体语义。KGIN最终产生高质量的用户和项目表示。3.1用户意图建模与之前基于GNN的研究[38,41,47]不同,这些研究假设用户与物品之间没有或只有一种交互关系,我们的目标是捕捉用户行为受多种意图影响的直觉在这里,我们将意图定义为用户选择物品的原因,它反映了所有用户行为的共性。以电影推荐为例,可能的意图是对电影属性的多种考虑,例如明星和合作伙伴的组合,或导演和流派的组合。不同值得一提的是,注意力不是针对单个用户,而是提炼所有用户的共同模式。3.1.2意图的独立性建模。不同的意图应该包含关于用户偏好的不同信息[23,24]。如果一个意图可以被其他意图推断,那么描述用户-项目关系可能是冗余的并且信息量较少;相反,具有唯一信息的意图将提供一个有用的角度来表征用户的行为模式。因此,为了更好的模型容量和可解释性,我们鼓励意图的表示彼此不同。在这里,我们引入了一个独立建模模块来指导独立意图的表示学习。这个模块可以简单地通过应用统计测量来实现,例如互信息[2],皮尔逊相关[33]和距离相关[32,33,43],作为正则化器。这里我们提供两种实现:相互信息。我们最小化任何两个不同意图的表示之间的互信息,从而量化它们的独立性。这种想法与对比学习相吻合[7,12]。更正式地说,独立性建模是:意图抽象用户的不同行为模式。这可以用更细粒度的假设--由相似意图驱动的用户--来LIND=–∈P.p′exp(s(ep,ep)/τ),(3)∈Pexp(s(ep,ep′)/τ)对物品也有相似的偏好这种直觉促使我们在意图的粒度上对用户-项目关系进行假设是所有用户共享的意图集合,我们可以将统一的用户-项目关系切片到意图中,并将每个u,i对分解为u,p,ip。因此,我们将用户-项目交互数据重新组织为异构图,称为意图图(IG),这与以前的作品中采用的同构协作图不同[41,47]。3.1.1意图的表征学习。虽然我们可以其中s是测量任何两个意图表示的关联的函数,其在这里被设置为余弦相似度函数;并且τ是softmax函数中的温度的超参数。距离相关它测量任何两个变量的线性和非线性只有当这些变量是独立的。最小化用户意图的距离相关性使我们能够减少不同意图的依赖性,其被公式化为:用潜在向量表达这些意图,很难明确地识别每个意图的语义。一个简单的解决方案是LIND=p,p′∈P,p<$p′dCor(ep,ep′),(4)将每个意图与一个KG关系耦合,这是由KTUP [4]提出的。然而,该解决方案仅孤立地考虑单个关系,而没有考虑关系的交互和组合,从而无法细化用户的高级概念。其中,rdCor(·)是与意图p的距离,pdCor(e,e′)=,,(5)影响意图P1,而关系R3和R4对意图P2贡献更大。因此,我们为每个意图p分配KG关系上的分布-技术上,施加注意力策略来创建意图嵌入:ep=α(r,p)er,(1)r∈R其中er是关系r的ID嵌入,其被分配有注意力得分α(r,p)以量化其重要性,形式上:其中,rdCov(·)是两个表达的距离c o方差,dVar(·)是每个意图表达的距离方差。优化这种损失可以鼓励不同意图之间的分歧,使这些意图具有清晰的边界,从而赋予用户意图更好的可解释性。3.2关系路径感知聚合在对用户意图进行建模之后,我们将继续在基于GNN的范式下进行用户和项目的表示学习先前α(r,p)=. 经验(wrp)、(二)基于GNN的推荐模型[38,39,41]表明,邻域聚合方案是一种很有前途的端到端r′∈Rexp(wr′p)其中WRP是特定于某个关系r和某个意图p的可训练权重。为了简单起见,我们在这里使用权重,并在未来的工作中进一步探索复杂的注意模块。将多跳邻居集成到表示中的方法更具体地,自我节点的表示向量通过递归地聚合和变换其多跳邻居的表示来计算··意图例如,关系r1和r2的组合为:881()下一页()iN{( )|( )∈G}N{( )|( )∈C}(·)()下一页∈iu∈(·)p′∈Pexp(ep′e(0))ei= fKG {(ei 、e、r、e、v)|(r,v)∈ Ni}uu我表达了与导演和明星概念相关的信号,WWW'21,2021年4月19日至23日,卢布尔雅那,斯洛文尼亚Wangetal.意图表述用户表示������用户意图������=#���(���,���)������n∈R������(���编号 ������������������������(���项目/实体表示��������� (,)���������中文(简体)|N���|���������(���������(���,���)������(,)∈N���|N���|���(,)∈N������( ,)������������……������������������ (���,,)���我的天������������������中文(简体)��������� ������������������ ���������������������������������(���,)���������������������……���������������������������……���������������������������������������(���,)������������独立建模������������������������������......���������������(���,)��������������� (���,,)������������������������所有用户User-Intent-Item三元组实体-关系-实体三元组���������������������=������������用户意图建模Intent Graph(IG)基于知识图(KG)的聚合层最终用户(或项目)表示图3:拟议的KGIN框架的说明最好用彩色看然而,我们认为,目前的聚合方案大多是基于节点的,这限制了结构知识的益处,这是由于两个问题:(1)聚合器专注于合并邻域信息,而不区分哪些路径她的行为。因此,我们引入注意力得分β u,p来区分意图p的重要性,如下所示:exp(epe(0))他们来自。考虑图2中的示例,p2u1中文(简体)β(u,p)=.、u2-跳邻居v2:u1p1I1R2v2和u1I2R2v2.哪里(0)D当构造n<$e−−uralm<$e−s−sagespassedb<$y−时,e<$−node-eu∈R是用户u的ID嵌入,以使v2基于的聚合器在很大程度上通过衰减因子来变换和重新缩放V2因此,它们不足以保留表征中的结构信息。此外,(2)当前基于节点的聚合器通常通过注意力网络[38,41,47]在衰减因子中建模KG关系,以控制从邻居传播多少信息。这限制了KG关系对节点表示的贡献。此外,没有关系依赖重要性评分个性化。(2)与以前研究中使用衰减因子[38,41,47]或正则化项[41]的想法不同,我们强调了意图关系在聚合过程中的作用因此,我们通过元素乘积β u,pepe(0)。因此,我们能够在用户表示中显式地表达一阶意图感知信息3.2.2知识图谱上的聚合层。然后我们(例如, (p2,r2,r3)在路径u1p2上i2r2v2r3v3)在一个重点放在KG的汇总方案上作为一个实体,明确的时尚。Hence,we<$a−−imto<$−d−evise<$a−relationalpath-aware聚合方案来解决这两个限制。3.2.1意 图 图 上 的 聚合层。 我们首先从IG中提炼协作信息。如前所述,CF效应[26]通过假设行为相似的用户对项目有相似的偏好,可以很好地描述用户模式 这启发我们对待个人历史(即, 项目a它可以将其他连接的实体作为其属性,这些属性反映了项目之间的内容相似性。例如,电影《霍比特人I》可以由导演彼得·杰克逊和主演马丁·弗里曼来描述。更正式地说,我们使用I=r,vi,r,v来表示关于项目i的属性和一阶连接性,然后整合来自连接实体的关系感知信息以生成项目i的表示:用户以前采用的)作为个人(一).(0)(0)意图将对物品表现出类似的偏好 考虑IG中的用户u,我们使用u=p,i u,p,i来表示意图感知历史和u周围的一阶连通性。从技术上讲,我们可以整合来自历史项目的意图感知信息,以创建用户u的表示:e(1)= fIG. . (e(0),ep,e(0))|(p,i)∈Nu∈N,(6)其中e(1)Rd是从一阶连接性收集信息的表示;并且fKG是从每个连接i、r、v提取和整合信息的聚合函数。在这里,我们考虑聚合器中的关系上下文直觉上,每个KG实体在不同的关系上下文中具有不同的语义和含义比如昆汀·塔伦蒂诺其中e(1)Rd是用户u的表示;并且fIG是表征每个一阶连接的聚合器函数(u,p,i)。他将fIG(·)实现为:两个三胞胎(昆汀·塔伦蒂诺,导演,被解放的姜戈)和(昆汀·塔伦蒂诺,明星,被解放的姜戈)。然而,以前的研究[38,41,47]仅通过注意机制对衰减因子中的KG关系进行建模,以控制e(1)=1 .β(u,p)ep e(0),(7)昆汀·塔伦蒂诺的贡献,u|Nu|我(p,i)∈Nu被解放的姜戈相反,我们将聚合器中的关系上下文建模为:其中,ei(0)是项i的ID嵌入;k是元素-11.0明智的产品我们用两种见解来驾驭它。(1)对于给定的用户,不同的意图将具有不同的是自我节点之间的三个信息通道及其用户. 此外,在我们的IG中,我们可以在用户意图的粒度级别上捕获更细粒度的模式,通过假设具有类似(882激励ei()=|Ni| (r,v)∈Nierev(),(10)883vv⊙0v2O(·)OO{()|()∈ O()∈ O一、Ni l(|P |(|P |−)/)|P|(一)|C||P||P |−)/)|P |−)/).我s∈Nl|Ns 2|SL分别在KG上的聚集中,更新实体表示的时间开销为O(L| G|D.其中|G|是KG数uv与知识图谱2021年4月19日至23日其中e(0)是实体v的ID嵌入。 对于每个三元组(i,r,v),我们通过将关系r建模为投影或旋转运算符来设计关系消息e re()。因此,关系消息能够揭示三元组所携带的不同含义即使它们得到相同的实体。类似地,我们可以得到每个KG实体v∈ V的表示e(1)。3.2.3 捕捉关系路径。在模拟了第一个-哪里=u,i,ju,i+,u,j−是由观察到的交互+和未观察到的交互-组成的训练数据集;σ是sigmoid函数。 通过结合独立性损失和BPR损失,我们最小化以下目标函数来学习模型参数:LKGIN=LBPR+λ1LIND+λ2LIND2,(16)其中,Θ ={e(0),e(0),er,ep,w|u ∈ U,v ∈ V,p∈ P}是在方程(6)和(9)中,我们进一步叠加u v更多的聚合层来收集来自高阶邻居的有影响的信号。从技术上讲,我们递归地将用户u和物品i在l层之后的表示公式化为:e(l)=fIG. . (e(l−1),ep,ei(l−1))|(p,i)∈Nu∈N,模型参数(注意项目集);λ1和λ2分别是控制独立性损失(等式(6))和L2正则化项的两个3.5模型分析.第3.5.1节型号尺寸。最近的研究[48]表明,使用ei(l)=fKG{(ei(l−1),er,e(l−1))|(r,v)∈Ni},(11)其中e(l−1),e(l−1),e(l−1)分别表示非线性特征变换可能使GNN难以训练因此,在KGIN的聚合方案中,我们丢弃非线性激活函数和特征变换ui用户u ivv,它记住了关系信号矩阵因此,KGIN的模型参数包括(1)ID、项和实体从它们的(1- 1)跳邻居传播。受益于我们的关系建模,这些表示能够存储用户、KG实体(包括项目)和KG关系的嵌入{e(0),e(0),er |u ∈ U,v ∈ V};以及(2)用户意图的ID嵌入多跳路径的整体语义,并强调关系uv{1}|p以及注意力权重W。个依赖项让r1r2rlbe a - 跳路径ep∈P}以项目为s=i−→s1−→···sl−1−→sll3.5.2时间复杂度。KGIN的时间成本主要来自于i,它包含一个连接的三元组序列它的关系路径仅仅被表示为关系的序列,也就是说,(r1,r2,···,r1). 我们可以将表达式ei(l)重写如下:从用户意图建模和聚合方案。在IG上的聚合中,时间复杂度为O(L| C|d),其中L,|C|,d表示数字e(l)=.我er1er2erl⊙ ⊙···⊙中文(简体三个字,一个字,一个字,其中L是所有s跳路径的集合显然,这种表示反映了关系之间的相互作用,并保留了路径的整体语义这与目前知识感知的决策者采用的聚合机制,忽略了KG关系的重要性,从而无法捕获关系路径。3.3模型预测在L层之后,我们获得用户u和物品i在不同层的表示e= e(0)+··+e(L),e= e(0)+··+e(L)。(十三)三胞胎对于独立性建模,距离相关的成本为O12,其中是用户意图的数量。总的来说,整个训练期的时间复杂度为O Ld+L d +1 2 .在相同的实验设置下(即,在不同层的表示大小),KGIN具有与KGAT和CKAN相当的复杂性。4实验我们提供了实证结果来证明我们提出的KGIN的有效性这些实验旨在回答以下研究问题:• RQ1:KGIN的表现如何,与最先进的相比uu uii ii知识感知推荐模型?通过这样做,路径的意图感知关系和KG关系依赖性被编码在最终表示中。此后,我们使用用户和项目表示的内积yui=euei。(十四)3.4模型优化我们选择成对BPR损失[26]来重建历史数据。具体来说,它认为对于给定的用户,她的历史项目应该被分配比未观察到的项目更高的预测分数RQ2:设计的影响是什么(例如,用户意图的数量和独立性,关系路径的深度)对KGIN的关系建模的改进?RQ3:KGIN能否提供对用户意图的洞察,并给出可解释性的直观印象?4.1实验设置4.1.1数据集描述。在实验中,我们使用了三个基准数据集进行书籍,音乐和时尚服装推荐:(1)我们使用KGAT发布的Amazon-Book和Last-FM数据集[41];(2)我们进一步介绍了Alibaba-iFashionLBPR =(u,i,j)∈O– lnσ(yui– 新的··|Ns 1||Nsl|u884),(十五)数据集[8],以调查项目知识的有效性这是从阿里巴巴在线购物系统收集的时尚服装数据集服装被视为被推荐的项目885----我的天|P |WWW'21,2021年4月19日至23日,卢布尔雅那,斯洛文尼亚Wangetal.表1:数据集的统计亚马逊图书Last-FM阿里巴巴iFashion用户-项目交互#用户#项目#交互70,67924,915847,73323,56648,1233,034,796114,73730,0401,781,093知识图#实体#关系三胞胎数量88,572392,557,74658,2669464,56759,15651279,155对于用户来说,其中每一套服装由多个时尚工作人员组成(例如,上衣、下装、鞋、配饰),并且这些五线谱遵循时尚分类并且被分配有不同的时尚类别(例如,牛仔裤、T恤)。提取服装的KG数据等属性此外,为了保证数据质量,我们采用10核设置,即,丢弃具有少于10个交互的用户和项目,并且过滤掉涉及少于10个三元组的KG实体。表1中总结了数据集的统计,其中我们仅列出了典型关系的数量,并在实验中构造了具有逆关系的三元组。紧接着先前的研究[41,45],我们使用相同的数据分区。在训练阶段,每个观察到的用户-项目交互都是一个正实例,而用户之前没有采用的项目被随机抽样以将用户配对为一个负实例。4.1.2评价 在评估阶段,我们进行了所有排名策略[20],而不是像遗漏一个项目[44]或抽样一小部分用户[38,39,47]这样的抽样指标。更具体地说,对于每个用户,她以前没有采用的全部项目被视为负面,测试集中的相关项目被视为正面。所有这些项目的排名的基础上的推荐模型的预测为了评估top-K推荐,我们采用协议[20]:recall@K和ndcg@K,其中K默认设置为20我们报告测试集中所有用户的平均指标。4.1.3替代基线。 我们将KGIN与最先进的方法进行比较,包括无KG(MF),基于嵌入(CKE)和基于GNN(KGAT,KGNN-LS,CKAN和RGCN)的方法:MF [26](矩阵分解)只考虑了用户-项目交互,而KG不变。从技术上讲,它使用用户和项目的ID嵌入来执行预测。CKE[51]是一种代表性的基于嵌入的方法,它利用了从TransR [22]导出的实体的KG嵌入。作为MF框架下项的ID嵌入其中,KG关系仅用作TransR中的约束,以正则化端点的表示KGNN-LS[38]是一个基于GNN的模型,它将KG转换为用户特定的图形,然后考虑用户偏好的KG关系和标签的平滑度在信息聚合阶段,从而生成用户特定的项目表示。它模拟衰减因子中的关系。KGAT[41]是一个最先进的基于GNN的推荐器。它在整体图上应用关注的邻域聚合机制,该机制将KG与用户-项目图相结合,以生成用户和项目表示。用户-项目关系和KG关系作为邻接矩阵的关注权重表2:总体性能比较。亚马逊图书召回ndcgLast-FM召回ndcg阿里巴巴iFashion召回ndcgMF0.13000.06780.07240.06170.10950.0670CKE0.13420.06980.07320.06300.11030.0676KGAT0.14870.07990.08730.07440.10300.0627KGNN-LS0.13620.05600.08800.06420.10390.0557CKAN0.14420.06980.08120.06600.09700.0509R-GCN0.12200.06460.07430.06310.08600.0515KGIN-30.1687米0.0915磅0.0978万0.08480.1147米0.0716米杂质%百分之十三点四四百分之十四点五一百分之十一点一三百分之十三点九七3.98%5.91%CKAN[47]建立在KGNN-LS的基础上,KGNN-LS分别在用户-项目图和KG上利用不同的邻域聚合方案来获得用户和项目嵌入。R-GCN[27]最初是为知识图完成任务提出的,它将各种KG关系视为不同的聚合相邻节点时的信息流通道。在这里,我们将其转移到推荐任务。4.1.4参数设置。我们在PyTorch中实现了我们的KGIN模型,并发布了我们的实现(代码,数据集,参数设置和训练日志)以促进可重复性。为了公平比较,我们将ID嵌入d的大小固定为64,优化器为Adam [18],所有方法的批大小为1024。进行网格搜索以确认每种方法的最佳设置-更具体地说,调整学习率10- 4,10- 3,10- 2,附加约束的系数(例如, L2所有方法中的正则化,KGIN中的独立建模,CKE和KGAT中的transR,KGNN-LS中的标签平滑)检索 10−5、 10−4、、 10−1,以及GNN层的数量对于基于GNN的方法,在1、 2、 3中调整L此外,对于KGNN-LS和CKAN,我们将邻域大小设置为16,批次大小设置为128。我们使用Xavier [11]初始化模型参数,同时使用MF的预训练ID嵌入作为KGAT的初始化。KGIN的详细设置见附录A.1。我们观察到使用等式(3)和(4)具有相似的趋势和性能,因此报告等式(3)的结果。我们使用KGIN-3表示推荐模型的三个关系路径聚合层,和其他类似的符号在没有指定的情况下,我们将用户意图的数量固定为4,关系路径聚合层的数量L固定为3。此外,在第4.3.1节和第4.3.2节中,我们通过改变K来研究它们的影响。{1, 2, 4, 8}和{1, 2, 3}中的L。4.2性能比较(RQ 1)我们先来比较一下w.r.t. recall@20和ndcg@20。经验结果报告于表2中,其中%Imp. 表示最佳性能方法(带星号)相对于最强基线(带下划线)的相对改进。我们发现:KGIN在所有指标方面始终优于三个数据集的所有基线 更具体地 说 , 它 在 最 强 的基 线 w.r.t. 上 实 现 了 显 着 的 改 进 。ndcg@20乘1451%,13. 97%,5。在亚马逊图书、Last-FM和阿里巴巴iFashion中分别为91%。 这证明了KGIN的合理性和有效性。我们将这些改进归功于KGIN的关系建模:(1)通过揭示用户意图,·······886|P |--与知识图谱2021年4月19日至23日表3:用户意图和KG关系的存在的影响表5:独立建模的影响亚马逊图书w/ Ind不含IndLast-FMw/ Ind不含Ind阿里巴巴iFashionw/ Ind不含Ind距离相关0.03890.34900.03650.49440.01120.3121表4:层数L的影响0.1700.1680.1650.1631 2 48意图数量(a) 亚马逊图书0.0910.0900.0890.0990.0980.0970.0961 2 48意图数量(b) Last-FM0.0860.0850.085KGIN能够更好地描述用户和项目之间的关系,并产生更强大的用户和项目表示。相比之下,所有基线都忽略隐藏的用户意图,并将用户项边缘建模为收集信息的同质通道;(2)受益于我们的关系路径聚合方案,KGIN可以保留路径的整体语义并从KG收集比基于GNN的基线更多的信息信号(即,(3)在IG和KG上应用不同的聚合方案,使得KGIN能够更好地将协作信号和项目知识编码为用户和项目表示。通过对KGIN在三个数据集上的联合分析,我们发现Amazon-Book的改进比Alibaba-iFashion更显著。这是合理的,因为(1)亚马逊图书上的交互和KG数据都提供了比Alibaba-iFashion更密集和更丰富的信息;以及(2)在Alibaba-iFashion中,一阶连接(时尚服装,包括时尚员工)主导KG三元组。这表明KGIN擅长实现远程连接的潜力。让KG未被利用限制了MF的性能通过简单地将KG嵌入到MF中,CKE的性能优于MF。这些发现与之前的研究[4]一致,表明了KG等辅助信息的重要性。基 于 GNN 的 方 法 ( 即 , KGAT、 CKAN 、 KGNN-LS ) 在Amazon-Book和Last-FM中的表现优于CKE,表明了对远程连接进行建模的重要性。 这些改进来自于使用节点的局部结构--更具体地说,是多跳邻域--来改进表示学习。不过,在阿里巴巴-iFashion上,CKE的表现要比他们好。一些可能的原因是:(1)这些基于GNN的方法涉及额外的非线性特征变换,这对训练来说是相当繁重和繁重的,因此降低了性能[14 , 48]; ( 2 ) CKE 中 的 TransR 成 功 地 捕 获 了 Alibaba-iFashion中的主要一阶连接。KGAT、KGNN-LS和CKAN的结果处于同一水平,优于R-GCN。虽然在R-GCN中通过KG关系转换邻居的信息的效用4.3KGIN(RQ2)由于关系建模是KGIN的核心,我们还进行了消融研究,以调查有效性-特别是,如何图4:意图数量的影响(|P |). 最好的颜色。用户意图和KG关系的存在、关系路径聚合层的数目、用户意图的粒度以及用户意图的独立性影响我们的模型。4.3.1存在用户意图的影响&KG关系。 我们首先回答这个问题:考虑用户意图或KG关系是否重要? 为此,通过(1)丢弃所有用户意图和KG关系(称为KGIN- 3w/o& IR)以及(2)仅移除所有用户意图(= 0)(称为KGIN-3w/o I)来构造两个变体。我们在表3中总结了结果。显然,与表2中的KGIN-3相比,去除所有关系(即,KGIN-3w/o IR)显著降低了预测精度,表明了关系建模的必要性更具体地说,KGIN-3w/o I R只在一个空间中传播节点类似地,使隐藏的用户意图未被探索(即,KGIN-3 w/o I)也降低了性能。虽然KGIN-3w/o I保留了KG关系的建模,但它只考虑了用户的粗略偏好,从而导致次优的用户表示。4.3.2模型深度的影响。然后,我们考虑改变关系路径聚合层的数量。堆叠更多的层能够集成由较长距离连接承载的信息(即,更长的路径)转换为节点表示。在这里,我们在1、2、3的范围内搜索L,并在表4中总结结果。我们注意到:在大多数情况下,增加模型深度能够增强预测结果更具体地说,KGIN-2相对于KGIN-1实现了显著的改进我们将这种改进归因于两个原因:(1)堆叠更多的层,探索更多的相关项目连接的一些KG三元组,加深了对用户兴趣的理解KGIN-1仅采用一阶连通性(例如,用户-意图-项目三元组,KG三元组),而KGIN-2揭示了两跳路径;(2)更多与用户意图相关的信息来自更长的关系路径,从而更好地分析用户对项目的偏好。在 KGIN-2 之 后 继 续 进 行 更 多 探 索 , KGIN-3 的 结 果 在Amazon-Book和Last-FM中始终更好。这从经验上表明,高阶连通性与二阶连通性是互补的,从而产生更好的节点表示。召回ndcg召回ndcg······亚马逊图书召回ndcgLast-FM召回ndcg阿里巴巴iFashion召回ndcg不含I R0.15180.08160.0802 0.06690.08620.0530不含I0.16270.08700.0942 0.08190.11030.0678亚马逊图书召回ndcgLast-FM召回ndcg阿里巴巴iFashion召回ndcgKGIN-10.14550.07660.08310.07070.10450.0638KGIN-20.16520.08920.09200.07910.11620
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Haskell编写的C-Minus编译器针对TM架构实现
- 水电模拟工具HydroElectric开发使用Matlab
- Vue与antd结合的后台管理系统分模块打包技术解析
- 微信小游戏开发新框架:SFramework_LayaAir
- AFO算法与GA/PSO在多式联运路径优化中的应用研究
- MapleLeaflet:Ruby中构建Leaflet.js地图的简易工具
- FontForge安装包下载指南
- 个人博客系统开发:设计、安全与管理功能解析
- SmartWiki-AmazeUI风格:自定义Markdown Wiki系统
- USB虚拟串口驱动助力刻字机高效运行
- 加拿大早期种子投资通用条款清单详解
- SSM与Layui结合的汽车租赁系统
- 探索混沌与精英引导结合的鲸鱼优化算法
- Scala教程详解:代码实例与实践操作指南
- Rails 4.0+ 资产管道集成 Handlebars.js 实例解析
- Python实现Spark计算矩阵向量的余弦相似度
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功