没有合适的资源?快使用搜索试试~ 我知道了~
首页>外文书>人文>心理励志> User Modeling,WWW 2018,2018年4月23日至27日,法679产品尺寸推荐的贝叶斯模型摘要Vivek Sembium亚马逊印度eksem@amazon.comLavanya Tekumalla亚马逊印度lavanya@amazon.com拉杰夫·拉斯托吉亚马逊印度rastogi@amazon.com阿图尔·萨罗普亚马逊印度asaroop@amazon.com在诸如服装和鞋子的流行类别中缺乏校准的产品尺寸导致客户购买不正确的尺寸,这反过来又由于合身问题而导致高退货率 我们解决了基于客户购买和退货数据的产品尺寸建议问题。我们提出了一种新的方法的基础上贝叶斯logit和概率回归模型的顺序类别{小,适合,大}模型的大小适合客户和产品的潜在大小之间的差异的函数。我们提出了基于平均场变分推理的后验计算,利用Polya-Gamma增强的logit先验,这导致简单的更新,使我们的技术能够有效地处理大型数据集。 我们的贝叶斯方法有效地处理了数据中的噪声和稀疏性问题,提供了强大的建议。现实生活中的鞋数据集的离线实验表明,我们的模型在6个数据集中的5个数据集中优于最先进的。 并且当预测尺寸适配结果时,导致AUC相对于基线改善17-26%。关键词贝叶斯,个性化,推荐,Polya-Gamma ,Probit,变分推理,Gibbs抽样ACM参考格式:Vivek Sembium 、 Rajeev Rastogi 、 Lavanya Tekumalla 和 Atul Saroop 。2018年。产品尺寸建议的贝叶斯模型。 在WWW 2018:2018年网络会议,2018年4月23日至27日,里昂,法国。ACM,New York,NY,USA,9页。https://doi.org/10.1145/3178876.31861491引言向客户推荐产品尺寸是电子商务领域中的一个重要问题尽管电子商务越来越受欢迎,但服装和鞋类等产品在网上购买仍然具有挑战性,退货率也创下新高导致产品退货过多的一个关键客户痛点是尺寸适配问题。选择合适的大小在线是很难由于多个本文在知识共享署名4.0国际(CC BY 4.0)许可下发布。作者保留在其个人和公司网站上以适当的归属方式传播作品的权利WWW 2018,2018年4月23日©2018 IW3C2(国际万维网会议委员会),在知识共享CC BY 4.0许可下发布。ACM ISBN 978-1-4503-5639-8/18/04。https://doi.org/10.1145/3178876.3186149图1:客户在鞋的网页上选择尺码。原因除了缺乏触摸和感觉体验之外,当在线购物时,跨品牌和产品类型的产品尺寸的可变性是一个主要挑战。本质上,品牌和产品类型遵循不同的尺寸约定,导致从目录尺寸到物理尺寸的不同映射。例如,Reebok的目录尺寸到物理尺寸的映射是:6 = 15cm,7 = 17cm,8 = 21cm,而对于Nike,它们是:6 = 16cm,7 =18cm,8 = 22cm。此外,即使在同一品牌内,尺寸也存在变化例如,耐克的跑鞋与步行鞋相比具有不同的尺寸方案。类似地,普通跑鞋与针对马拉松运动员的跑鞋相比具有不同的尺寸标准最后,几个卖家提供的不完整和不正确的尺寸图表加剧了这个问题,使客户难以选择正确的尺寸。在推荐产品尺寸的上下文中,顾客与电子商务网站的交互以以下方式发生:顾客访问产品的网页,并被提供从如图1所示的几种不同尺寸中选择特定尺寸变体的选项。 尺寸推荐问题涉及推荐最适合客户的产品尺寸,从而改善客户体验。虽然有几种技术[2,9,15,18,29]解决了一般的产品推荐问题,但很少有与生成尺寸推荐相关的先前工作。首页>外文书>人文>心理励志> User Modeling,WWW 2018,2018年4月23日至27日,法680在产生准确的尺寸建议中存在两个抑制因素第一,我们不知道客户第二,产品真实尺寸的准确测量并不适用于所有尺寸变体。然而,关于客户的真实大小的有价值的信息在于客户先前购买的所有产品的购买历史。类似地,关于产品的真实尺寸的信息在过去购买过该产品的客户集合中是可用的。另一个重要的有价值的信息是退货历史记录,它表明购买历史记录中的产品是否适合客户,或者是由于尺寸选择不正确而被退回。然而,由于多种原因,从购买和再周转历史中推荐产品尺寸是困难的大多数电子商务客户是偶尔购买者。 即使是更频繁的追求者也不太可能从一个特定的类别中购买大量的物品,如鞋子。因此,大多数客户具有非常少的关联交易。同样受欢迎的产品往往会记录巨大的销售额,而大多数产品很少或没有相关的交易。因此,客户交易数据是高度稀疏的。此外,返回数据是高度嘈杂的,因为客户在返回物品时通常不指示正确的配件信息。事实上,我们已经发现了一个显着的分歧之间的客户的输入大小适合,而返回一个项目和客户的反应,一个独立的适合相关的调查。数据稀疏性和噪声构成了向客户提供准确尺寸建议的主要障碍。固有的数据稀疏性使得能够在有限的数据设置中学习客户和产品真实尺寸的技术成为必要,而由噪声购买和退货数据引起的不确定性使得需要在学习的客户和产品尺寸上计算稳健的置信度估计以做出有信心的推荐。出于这一点,我们追求贝叶斯处理的问题。我们提出了一个潜在的因素模型,利用广泛的信号,如历史的产品购买,客户和产品尺寸信息的目录中的客户和产品的退货,以推断真实(潜在)的大小 我们提出了贝叶斯logit和概率回归模型与顺序类别的大小拟合数据建模,这使我们能够捕捉不同的fitSuitabilityCode,如小,适合或大客户提供的。我们提出了有效的平均场变分推理方法,利用辅助变量技术,如Polya-Gamma增广-灰近似后验分布在客户和产品的真实尺寸,并使用后验分布估计的概率,一个特定的尺寸变量的产品将适合客户。 这样的贝叶斯处理使我们能够通过基于目录数据将先验放置在客户和产品真实尺寸上来处理数据稀疏性问题,同时使得能够计算后验分布上的置信区间,以提出有信心的建议,尽管有噪声训练数据。在现实生活中的鞋数据集的实验中,我们表明,我们的贝叶斯模 型 利 用 客 户 提 供 的 退 货 信 息 , 在 预 测 购 买 交 易 的 fitSuit-abilityCode结果时,AUC比基线高17-26%。本文其余部分的结构如下。 在第2节中,我们回顾了相关的工作,而在第3节中,我们正式定义了大小推荐问题。在第4节中,我们提出了贝叶斯模型的大小建议,学习潜在的客户和产品的规模,有效的后验计算的基础上平均场变分推理。 在第5节中,我们在现实世界的亚马逊鞋数据集和综合生成的数据上评估了我们的模型,并显示出与基线相比的显着改进。在第6节中,我们讨论了我们的模型的各种扩展,并在第7节中提供结论性意见。2相关工作虽然已经提出了几种技术来解决一般推荐问题[3],但在大小推荐方面的工作很少 在解决一般推荐问题的技术中占主导地位,并且与我们的工作最相关的是基于矩阵分解的潜在因素模型[15,18,19,29]。已经有扩展模型一般非高斯分布[5],捕捉不同的用户偏好[7,26,27],是基于张量因式分解[16,22,27]和双线性模型[2,9]。在[11,14,28]中,作者采用贝叶斯方法来解决推荐问题,并[20,31]利用用户评论,产品元数据和其他信息。还存在利用其他上下文信息的方法,包括诸如年龄、天气和设备信息的物理上下文[1,10,23,24]。然而,用于一般推荐问题的上述技术不适合于尺寸推荐,因为它们不利用附加的序数信息,诸如(1)产品的目录尺寸和(2)客户提供的用于购买的产品的适合性结果。在本文中,我们建立贝叶斯模型,利用规模语义预测的顺序结果(小,适合,大)的基础上的客户和产品的潜在规模之间的差异,在一个交易。我们注意到,已经有先前的工作探索了有序回归问题的贝叶斯处理[4,8,12,21,25]。 我们的模型不同于通常的有序回归,因为预测变量(客户和产品之间的大小差异)本身是潜在的。我们提出的推理策略利用最先进的辅助变量技术,例如变分推理设置中的Polya-Gamma增强[25],从而产生用于计算后验的简单有效的算法。据我们所知,在学术文献中也解决了尺寸推荐的具体问题的唯一先前工作是[30]。在[30]中,作者提出了一种非贝叶斯方法,该方法将客户和产品真实尺寸的学习问题公式化为最小化精心构造的损失函数之一。损失函数最小化是通过迭代算法进行的,该算法基于客户退货实例通过购买图在客户和产品尺寸之间传播更新。然而,[30]的确定性方法学习产品和客户真实尺寸的点估计,由于客户提供的嘈杂返回代码,其可能具有高误差,由极端数据稀疏问题加剧这进而可能导致不正确的推荐。我们对这个问题的贝叶斯处理使我们能够将先验放在客户和产品大小上,并获得这些潜在大小的后验,我们对这些潜在大小进行平均,以获得更稳健的拟合概率估计(以及置信区间)首页>外文书>人文>心理励志> User Modeling,WWW 2018,2018年4月23日至27日,法681()下一页()(|)(− −)−()≤(|)()≥(|)联系我们·()−·()−e()∈(−)(−)|- -|→()∈()∈|)(·)SB2B1()·(−)准确的建议。我们通过实验将我们的技术与第5节中的[30]进行了比较,并在6个数据集中的5个数据集中优于他们的技术。3尺寸推荐问题我们现在正式描述大小推荐问题。产品以多种尺寸提供,原始产品被称为父产品,而其各种尺寸变体被称为子产品。 设C表示目录中所有客户的集合,P表示目录中所有子产品的集合。数据包括 三 元 组 形 式 的 过 去 客 户 交 易 ( 客 户 、 子 产 品 、fitSuitabilityCode)。形式上,令D=i,j,yij表示交易三元组数据,其中子产品j由客户i购买,并且如果子产品未被客户退回,则yij是Fit,或者如果它被客户退回,则y ij是由客户我们的目标是推荐最好的儿童产品适合特定(客户、父产品)对大小我们这样做满足:(1)如果fαsi,tjb1则P yij=小si,tj 大;(2) 如果fαsi,tjb2则P yij=大si,tj(3)若b2f<αsi,tjb1<,则Pyij=Fitsi,tj是大的.下面,我们定义具有所需属性的数据似然函数令潜在大小向量β =(si,…sc,t1,..,tp,b1,b2)T,并且对于事务(i,j,. )∈D,定义数据向量xi js =(0,...,0,α,0,..,0,−α,0,..,0,−1,0)T和x,i,f=0,.. 0,α,0,..,0,α,0,..,0,0,1T,其中α和α分别存在于si和tj的位置。注意,学习{si}和{tj}的后验等价于学习β的后验。此外,βT xijs=fαsi,tjb1和βT xijf =fα si,tjb2。为了定义对应于fitSuitabilityCode的三个类的似然函数,我们引入两个二进制随机变量yijs0,1和yijf0,1,概率如下分布:P(yijs|si,tj,α,bl)=σ(yijs,βT·xijs)(1)不通过推断真实(潜在)尺寸的后验分布P(yijf|si,tj,α,b2)=σ(yijf,β·Xijf)客户和子产品使用D中的过去交易。 设si为客户i的潜在真实规模,tj为潜在真实规模其中,yθσ(y,θ)=1+eθ(2)的子产品j。直观地,(1)如果i,j,拟合D,则si应当尽可能接近tj或sitj0;(2)如果i,j,小D,则sitj应当大于阈值bl>0;以及(3)如果i,j,大D,则sitj应当小于阈值bl>0。<一旦我们有了真实的尺寸估计,我们就向客户i推荐具有最高尺寸适合概率的子产品j。我们采用贝叶斯方法,其导致用于我们的尺寸推荐问题的以下公式We note that an alternate choice for the link function σ is theProbit, where P(yijs = 1|si,tj,α,b1) = Φ(βT · xijs) and P(yijf =1 si,tj,α,b1 = Φ βT xijf , where Φ is the CDF of the normal dis-tribution. 附录中详细探讨了概率单位法我们现在使用这些随机变量定义Small、Fit和Large的可能性,如下所示:P(yij=Smal i|si,tj,a,bl)=P(yijs=l|(3)问题陈述:给定过去的客户事务D、子产品的目录大小{cj}以及真实大小的先验,计算客户的真实大小{si}和子产品的真实大小{tj}的后验分布对于客户i和子产品j,使用计算出的真实尺寸后验估计尺寸匹配概率P(y,i,j)=Fi,t|si,tj,α,b1,b2)=P(y)/s= 0 |βT·xijs)·P(yijf = 1 |βT·xijf)P(yij= Large|si,tj,α,b1,b2)=P(y)/s= 0 |βT·xijs)·P(yijf = 0|βT·xijf)请注意(四)(五)P(yij=拟合|D)。Q为了简化本文其余部分的演示,我们1. 如果s为1。>>J,则fα(si,tj)−b1>>0. 然后,我P(yij=小|. )→将儿童产品称为简单的产品。4贝叶斯粒度推荐模型在本节中,我们将介绍我们的概率模型,以及学习客户真实规模{si}的后验分布的方案2. 若sitj,则fα(si,tj)−b10和fα(si,tj)−b20。<<<<<<那么,P(y,ij)=大|. )-1.3. 若b2fα(si,tj)b1.<<然后,P(yij)=拟合|. )-1.4. P(yij=小|. )+P(yij=拟合|. )+P(yij=大|. )=1。4.2生成模型我们将生成模型定义如下:和产品真实尺寸{tj},并利用它们来估计拟合大小概率P(yij =拟合|D)。我们考虑客户和产品1. 为每个客户2. 为每个产品i,画出真实尺寸si N(µi,σ 2)。真实尺寸为单一尺寸,每个帐户属于j,画出真实尺寸tj N(cj,σ 2)。一个人 我们处理多维大小向量和每个客户帐户多个人物角色的技术的概括可以在第6节中找到。3. 绘制模型参数b1N(µb1ter b2N(µb2,σ2)。,σ2)不模型参数-4.1 数据可能性设fαsi,tj=αsitj是一个参数函数,它等于顾客(si)和产品(tj)之间的真实尺寸之差,具有一个尺度参数α。 基于第3节中的先前讨论,我们希望数据可能为|si,tj)forfitSuitabilit yC odeyij4. 对于每个事务(i,j,yij)∈D:• 选择yij=小概率P(yij=Smal i|si,ti,a,bl)。• 选择yij=概率拟合P(y,i,j)=Fi,t|si,ti,a,bl,b2)。• 选择yij=大概率P(yij=Large|si,ti,a,bl,b2)。首页>外文书>人文>心理励志> User Modeling,WWW 2018,2018年4月23日至27日,法682(一)|)的情况下)()()∈βj()∈...X(()||(一)|))()=∼ ()2(|)()∼ ()(一)| )(|)∫然后,我们有那个P(W,β |D,Σ)dW ∝P(W,β,D| Σ)dW ∝.N(tj|σ2)·N(b|µb,σ2)在等式(2)中定义的sigmoid函数。后验分布VJσ2Ij(|)∝(|)我们把高斯先验的客户和产品的真实尺寸。的设W是∫fPolya-Gamma变量b∫lesw(x,y)∈D的集合.客户平均尺寸µi初始化为所有购买的适合客户的产品尺寸i.我们引入高斯先验对于b1N(µb1,σ2)和b2N(µb2,σ2)来控制移动P β,DΣP βD,Σ。在下面的小节中,我们将介绍Gibbs抽样和变分推断程序来近似-匹配增大的后P(W,β |D,Σ)-这些给我们大约-b1b2的模型参数。4.3模型训练的后验推理模型训练的目标是学习潜在大小P β D的后验分布。 在本节中,我们将讨论限制为使用等式(2)中定义的Logit链接函数进行推理,而我们将在附录中探索使用Probit的变分推理。为了简化符号,我们在等式(3)、(4)和(5)中的似然项中表示所有逻辑函数的集合数据和标签。(5)分别用X和Y表示。我们用D表示与D中的事务相对应的所有示例(xi,yi)的集合。因此,D包含事务(i,j,Small)∈D的示例(xijs,1),示例(xijs,0)和(xijf,1),并且β的后极图4.3.1基于Gibbs采样的方案。我们的Gibbs抽样程序循环通过wi和βj变量,根据其余变量的值从其分布中为每个变量抽取样本。wi的条件分布由下式给出(参见[25]详情:P(wi|β,xi)∝e−wi(βT·xi)2/2P(wi)=PG(wi| 1,βT·xi)(10)βj的条件分布由下式给出P(βj|β−j,W,D)P(W,D|β)P(β)对于事务i,j,大D,示例xijs,0和xijf,0。联合数据分布可以表示为:=∫P(W,D|β)P(β)dβjβj. ..我∝ 。 ..e((yi−1/2)(βT·xi)−wi·(βT·xi)2/2) ·SP(β,D|Σ)=(x,y)∈D σ(y,βT·x)·不N(si|μi,σ2)·Σ(6)B(xi,yi)∈Dxij≠0N(βj|µβj,σ2)Σjb∈{b1,b2}其中,其中,Σ={{µi},{cj},σs,σt,µb1,µb2,σb1,σb2},σ(y,θ)是1=1+。X y.wi·x2Dxβ由下式给出P(β |D,Σ)= ∫P(β,D| Σ)∝P(β,D| Σ)(7)和.µβjσβj(i,i)∈ij. ...ΣΣβP(β,D| Σ)dβ注意,以上等式(7)中的后验分布不能mj=Vj2个以上βj(xi,yi)∈Dxij≠0(yi−1/2) ·xij−wi·xij·l≠j βl·xil由于存在逻辑似然项和正态先验,因此可以以封闭形式计算。 为了使后验易于处理,我们为每个x,yD引入Polya-Gamma潜在变量w,其在似然中生成逻辑项,如[25]中所建议的。我们首先定义Polya-Gamma随机变量:XPG(b,a)4.3.2基于变分推理的方案。 我们应用平均场变分推理,使训练过程有效。我们使用提议分布q(W,β)来近似后验分布,其分解如下:q(W,β)= q(wi). q(βj)其中b>0且a∈R,如果i jD 1∞=2π2K=德克(k−1/ 2)2+a2/( 4π2)(八)最佳q*分布是使Kullback-Leibler散度KL qW,β PW,βD最小的分布。对于q wi,KL散度最小,当其中,D表示分布相等,并且是独立的伽马随机变量。令w PG1, 0。我们定义联合似然分布Pw ,yx , β=1e((y−1/2) ·(βT·x)−w·(βT·x)2/2)Pw。可以证明(见[25]中的定理1),联合似然分布上的w的期望是logistic的,即,yβTxlogq*(wi)= E−wi [log P(wi |β,xi)]+常数从等式(10)中代入Pwi,β,xi=Pgwi,β,τχι,logq*(wi)= Eβ [log P(wi |β,xi)]=Eβ[−wi(βT·xi)2/2+ logP(wi)]+conste·P(y|β,X)=1产品平均大小初始化为目录大小cj和=N(βj|mj,Vj)(11)≠0首页>外文书>人文>心理励志> User Modeling,WWW 2018,2018年4月23日至27日,法683JJ.. .Σ 2二、1+eβT·x=∞1e((y−1/ 2) ·(βT·x)−w(βT·x)2/2)P(w)dw(九)= −wi·E[βj]·xij+Var[βj]·xij/202+logP(wi)+常数首页>外文书>人文>心理励志> User Modeling,WWW 2018,2018年4月23日至27日,法684+ei js+ijfe(一)|.我i ijIja我[][][](||)(||)(||)()[][]1C1p121C1p12P(yij =拟合|D,Σ)=β值P(yij =拟合|β,Σ)·P(β|D,Σ)dβ从上面的表达式可以看出,q*(wi)是PG(1,ai),1 .一、R1个eβlT·xijf哪里,的。.JΣ 22J≈rl=11βlT·x·1βlT·x(16)(|)ai=E[βj]·xij +Var[βj]·xij (12)因此,拟合概率得分P yij=拟合D,Σ通过下式获得:简单地平均R个样本的拟合概率值我们类似地,对于βj,KL散度最小,当logq*(βj)∝E−βj[logP(βj|将Pβj β j,W,D代入等式(11),等式(13)简化为:q*(βj)=N(mj,Vj)其中,也可以使用样本β1,. . . 计算置信区间的β r用于拟合概率得分。令pi=σ(0,β1Τ·χijs)·σ( 1,β1Τ·χijf)是从第1个样本获得的拟合概率得分然后,我们可以取概率值集合P1,. . . ,pr,以获得拟合概率得分的置信区间的下边界和上边界。比如说第五届和第95百分位值将为我们提供拟合概率得分的90%置信区间注意对于客户和产品1个Vj1个2个以上βj(x,y)∈D∧x≠0E[wi]·x2Σ(十四)在少量事务中,大小后验分布将具有高方差。因此,这些客户和产品的置信区间将很大。相比之下,客户和产品参与的许多交易都会有规模后移. µβj。 .σ低方差和窄置信区间的分布mj=Vj2个以上βj(xi,yi)∈D∧xij≠0(yi−1/2)·xij. .l≠j中文(简体)一旦我们有了拟合概率得分和置信区间对于每个产品(父产品的子产品)的概率得分一种选择是推荐具有最大适配性的产品对于等式(12)中定义的q*(wi),E [wi]=21tanh(ai/2),并且对于q*βj在公式(4.3.2)中定义d,Eβj=mj且Varβj=Vj. 从随机初始值开始,我们迭代地更新E wi、E βj和Var βj直到收敛。 这些用于计算参数值ai、Vj和mj,如等式(12)、(14)和(15)所示。关于计算复杂度的注释:等式(12)涉及由于数据向量Xij的稀疏性质,每个事务的恒定时间操作导致计算w个变量的更新的O/D复杂度。计算所有βj变量的更新导致OD复杂度,因为等式(14)和(15)涉及每个交易在更新βj变量时贡献两次,一次用于对应的客户,一次用于产品。因此,我们的推理技术是有效的,并与数据线性缩放O D。4.4推荐产品尺寸给定一个客户i,我们推荐其尺寸匹配概率的预测分布最大的产品j设β1=(s1,. . . ,s1,t1,. . . ,t 1,b1,b1),. . . βr =(sr,. . . ,sr,tr,. . . ,tr,br,br)拟合概率得分置信区间的最高下界5实验在本节中,我们将评估我们的贝叶斯模型,用于在真实世界的亚马逊鞋数据和合成生成的数据集上进行尺码推荐。我们首先在第5.1节中描述了我们的实验设置,详细介绍了我们的评估指标和基线,然后在第5.2节中使用Amazon数据集进行实验,在第5.3节中使用合成数据集进行实验。5.1实验装置我们使用包含客户交易的离线鞋数据集来评估模型性能。这样的离线设置是限制性的,因为我们不观察(1)当我们的推荐被示出时客户离线设置中唯一可用的数据是由客户执行的交易和交易的结果fitSuitabilityCode。因此,我们通过分类器的能力来评估不同尺寸推荐方案的性能,所述分类器是基于从我们的模型学习的潜在客户和产品尺寸构造的。是分别使用第4.3.1节和第4.3.2节中描述的Gibbs采样或变分推断程序从β的后验中提取的r个样本。拟合尺寸概率的预测分布通过相对于β的后验分布边缘化来获得。∫请注意,[30]中也使用了类似的设置来执行模型性能基准测试。我们将可用的客户交易进行基于时间的分割,分为训练集和测试集。我们比较了我们的贝叶斯模型的结果举行了测试交易对基线模型与(1)目录大小作为潜在的产品规模和(2)cus-=∫β.P(yijs=0 |βT·xΣijs)·P(y我jf=1 |βT·xijf)·还在训练集上学习客户和产品的真实尺寸的学习的客户和产品潜在大小用于训练逻辑回归(线性)和随机森林(RF)分类器以产生.σ–E[βl]·xil概率得分另一种替代方案是在拟合概率得分估计中考虑不确定性来预测看不见的交易的fitSuitabilityCodeTomer基线算法P(β |D,Σ)dβ=fitSuitabilityCode作为输出。我们的贝叶斯模型进行了比较首页>外文书>人文>心理励志> User Modeling,WWW 2018,2018年4月23日至27日,法685联系我们N不不A B C D E F10.4M17M33.2M25M12.9M27M表1:所有数据集的事务计数汇总与测试集上的基线线性和RF分类器的性能度量进行对于贝叶斯logit我们还比较了我们的技术对国家的最先进的技术[30]通过协调下降从客户购买和退货历史构建的损失函数来学习客户和产品规模5.2鞋子数据实验数据分析:我 们 的 数 据 集 包 括 客 户 交 易 : customerId 、 produc-tId 和fitSuitabilityCode Small、Fit、Large。每个交易基于产品类别进一步分类,并由于专有原因分配标签A-F。表1显示了所有产品类别的交易计数 对于每个产品类别,我们按照时间顺序划分事务,前80%在训练集中,其余20%在测试集中。我们数据集中产品的目录尺寸代表美国尺寸方案,尺寸在4到20之间以0.5的间隔变化。不同目录大小的产品和交易的直方图分别如图2和图3所示。产品和交易的实际数量不会报告,以保护专有信息。图2和图3表明,客户更喜欢购买完整的目录尺寸,而不是一半的目录尺寸,这可能是由于许多产品的目录中缺少一半尺寸的可用性此外,请注意,除了类别大多数购买的产品的目录大小在8和表2:离线实验结果的总结我们报告了Logit、Probit、[30]构建的模型和基线随机森林模型的加权AUC超过基线线性模型的百分比改善(Best首先示出结果在我们实验的6个数据集中,如表2所示。这可以归因于我们的贝叶斯模型遵循原则概率方法,该方法允许它们(1)通过将先验放置在潜在大小上来克服数据稀疏性,(2)捕获由于推断的潜在大小后验中的数据中的噪声而导致的不确定性,以及(3) 通过对后验求平均,将不确定性传播到最终拟合概率得分中请注意,logit和probit模型的表现相似(除了“B”类别),因为logit和probit链接函数非常相似。5.3合成鞋数据实验在第5.2节中描述的真实世界设置中,由于与潜在变量(如真实大小和数据变异性)的可观察性相关的问题,我们只能对我们的算法在估计真实大小分布方面的能力进行间接推断因此,在本节中,我们进行实验来测量我们的推理过程在模拟数据集上恢复客户和产品数据生成过程:我们考虑目录大小从4到20,增量为0.5。我们遵循所描述的生成过程在节4.2中生成pro管道j的真实大小为tjN(cj,σ 2)12. 请注意,有目录的产品很少购买(其中C不j是随机选择的目录大小)和真实大小大小大于14,目录大小大于17的事务数几乎可以忽略不计。图4和图5分别显示了具有不同交易计数的产品和客户的直方图。再次,为了保护适当信息,没有报告图中的实际数字。请注意,很少有产品和客户在训练数据中有超过3个交易,这表明购买图是稀疏的。实验结果:我们使用各种数据集的离线实验的结果示于表2中(“Logit”是指具有logit链接函数的变分贝叶斯模型,并且“Probit”是指具有probit链接函数的变分贝叶斯模型)。出于专有原因,我们不报告不同模型的绝对加权AUC数值,而是报告加权AUC评分相对于基线的改善百分比线性模型我们还比较了我们的结果与那些获得si10,3是从4和20之间的正态截断中得出的。我们为10,000个儿童产品和10,000个客户生产尺寸为了生成事务,我们随机挑选一个客户,并随机挑选目录大小最接近客户真实大小的任何子产品我们从正常先验生成阈值bl和b2,并基于第4.2节中描述的生成过程将交易分类为{适合,小,大}。实验结果:客户和产品的估计和模拟潜在真实尺寸之间的RMSE连同在模拟产品真实尺寸时引入的σ 2的不同值的尺寸拟合预测的AUC示于表3中。 我们观察到:(1)“Logit”和“Probit”模型在AUC在0.886和0.972之间的尺寸拟合预测上都表现得非常好;(2)如可以预期的,我们的方法能够更准确地推断潜在产品和客户真实尺寸,因为在模拟产品真实尺寸时引入了较小的方差σ2。我们使用由[30]进行的工作观察我们的贝叶斯模型不还要注意,对于较高的方差值σ2,产品的RMSE显示加权AUC相对于基线模型有17-26%的相对改善。我们的模型也优于[30]在5上构建的模型尺寸与真实尺寸的偏差比在生成产品尺寸时引入的偏差低得多这样的行为可以归因于数据集RF[30个]LogitProbitD2.71%20.16%25.78% 26.16%E1.48%15.58%20.22%百分之二十点零四F2.50%17.31%19.42% 20.00%C3.79%16.10%19.70%百分之十九点三二首页>外文书>人文>心理励志> User Modeling,WWW 2018,2018年4月23日至27日,法686ABCDEF平均ABCDEF平均四六八十十二十四十六十八二十目录大小四六八十十二十四十六十八二十目录大小图2:不同目录大小的产品数量。图3:不同目录大小的事务计数ABCDEF平均ABCDEF平均1 2 3 4 5 67事务计数1 2 3 4 5 6 7事务计数图4:具有交易的产品的直方图图5:有交易的客户直方图算算产品差异拟合%客户RMSELogit客户RMSEProbit产品RMSELogit产品RMSEProbit加权AUCLogit加权AUCProbit0.594.270.2750.2270.4120.4130.9010.8860.783.610.3240.3050.4540.4710.9320.9280.972.590.3180.3300.4730.5020.9560.9511.163.830.3050.2660.5070.5640.9590.9511.355.900.2940.2690.5820.6840.9680.9611.549.290.2860.2690.7080.8410.9720.965表3:合成数据的RMSE总结在模拟数据中可获得更大百分比的小事务和大事务,从而导致减少的类不平衡。 在加权AUC度量方面也观察到类似的趋势。(3)与第5.2节的真实世界数据集上获得的结果6扩展我们描述了对模型的扩展,以(1)在6.1节中使用客户和产品功能来解决冷启动场景,(2)在6.2节中处理帐户中多个角色的购买,以及(3)在6.3节中利用多维尺寸,如长度和宽度。6.1利用客户和产品功能我们可以利用其他客户信息,如性别、年龄和忠诚度计划订阅和产品信息例如类别、品牌和产品类型。 利用这些特征可以处理冷启动场景并对抗数据稀疏性,从而提高模型的准确性。令客户i和产品j的特征向量分别为fi和dj我们可以在模型中加入这些特征,如下所示:(1) 包括数据向量xijs和xijf中的特征向量fi和d,以及潜在大小向量β中的对应权重向量w,f和w,d。产品数量产品计数客户数量事务计数首页>外文书>人文>心理励志> User Modeling,WWW 2018,2018年4月23日至27日,法687S不--∼()∈()()N(·)(2) 对于每个客户i,画出真实大小si N(wf′·fi,σ 2)。 对于每个客户j,绘制真实尺寸tjwд′σ1,σ2。因此,客户和产品真实尺寸的平均值通过对它们的特征执行回归来获得。可以使用如[2]中所述的Monte-Carlo EM算法来计算wf、wd、wf’、wd’的w值。6.2处理人物角色在实践中,客户账户可以由具有不同尺寸的多个人共享,例如,包括儿童和成人的不同家庭成员。因此,学习每个客户账户的单个真实尺寸可能导致不准确的真实尺寸估计。我们可以通过为每个交易i,j,yijD引入新的潜在变量z ij来为每个客户帐户建模多个人物角色。潜在变量z_ij捕获购买产品j的客户i的角色。 我们将单独的潜在大小Slk与客户i的第k个人物角色相关联,并且所有客户人物角色的大小都包括在潜在大小向量β中。此外,数据向量xijs和xijf具有分别存在于sizij和tj的位置中的值α和α。 我们的生成模型(在4.2节中描述)扩展如下。首先,我们从Dirichlet分布中为每个客户i绘制角色分布θi 对于每个交易i,j,yij,我们首先从多项式(Mult θi)中绘制角色z ij,然后绘制交易结果,其中概率由等式(3)-(5)中定义的似然函数给出。 我们的Gibbs抽样和变分推理程序可以很容易地扩展到近似潜变量β和β的后验分布{zij}。6.3多维尺寸我们可以扩展我们的技术来推断客户和产品的多维真实尺寸向量。各种尺寸捕获与尺寸相关的不同方面,诸如鞋子的长度和宽度,或者牛仔裤的腰部和长度。设d为尺寸维度的数量然后,客户真实大小si和产品真实大小ti(在潜在大小向量β中)以及尺度参数α(在数据向量Xijs和Xijf中)是d维向量。7结论在本文中,我们提出了新的贝叶斯logit和probit回归模型的顺序类别模型的大小拟合,和有效的算法的后验推理的基础上平均场变分推理和Polya-Gamma增强。在现实生活中的鞋子数据集的实验中,我们的贝叶斯模型在预测客户购买交易的尺寸匹配结果时,与基线相比,AUC高出17-26%。我们的模型在6个真实世界数据集中的5个中也优于最先进的基线。在模拟数据集上,我们表明我们的模型能够减少引入的大小方差的显着比例。在使用我们的Bayesion模型的logit或probit链接函数之间的选择方面,我们发现这两个模型在真实世界和模拟数据集上的表现非常相似 它们在模型训练过程中也有类似的推理时间(每次迭代1分钟),因此不会在两者之间留下明确的赢家。确认我们要感谢博士。 马蒂亚斯·西格对手稿早期版本的宝贵评论。引用[1] AdomA vI cIU s,G.,和TUZHIlin,A.上下文感知推荐系统。在推荐系统手册。Springer,2011,pp. 217-253[2] AgA rwA l,D.,和Chen,B.-C. 基于回归的潜在因素模型。 在Proceedingsofthe 15th ACM SIGKDD International Conference on Knowledge Discoveryand Data Mining(New York,NY,USA,2009),KDD '09,ACM,pp.19-28[3] AggA rwA l,C. C. 推荐系统。施普林格,2016年。[4] AlBERT,J.H、和ChIB,S.二元和多元响应数据的贝叶斯分析Journal of theAmerican Statistical Association 88,422(1993),669-679.[5] BAU er , J. , and NA nopoU los , A. 基 于 一 般 分 布 的 矩 阵 分 解 框 架 在Proceedings of the 8th ACM Conference on RecommenderSystems(New York,NY,USA,2014),RecSys’14,ACM,pp. 249-256[6] BI商店,C. M. 模式识别与机器学习。Springer,2006年。[7] CHArlin,L.,R.A nA th,R.McInerney,J.,和BleI,D.M. 动态泊松因子 分 解 在 Proceedings of the 9th ACM Conference on Recommender Systems(New York,NY,USA,2015),RecSys '15,ACM,pp. 155-162[8] 陈文H、and De
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 探索数据转换实验平台在设备装置中的应用
- 使用git-log-to-tikz.py将Git日志转换为TIKZ图形
- 小栗子源码2.9.3版本发布
- 使用Tinder-Hack-Client实现Tinder API交互
- Android Studio新模板:个性化Material Design导航抽屉
- React API分页模块:数据获取与页面管理
- C语言实现顺序表的动态分配方法
- 光催化分解水产氢固溶体催化剂制备技术揭秘
- VS2013环境下tinyxml库的32位与64位编译指南
- 网易云歌词情感分析系统实现与架构
- React应用展示GitHub用户详细信息及项目分析
- LayUI2.1.6帮助文档API功能详解
- 全栈开发实现的chatgpt应用可打包小程序/H5/App
- C++实现顺序表的动态内存分配技术
- Java制作水果格斗游戏:策略与随机性的结合
- 基于若依框架的后台管理系统开发实例解析
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功