搜索广告点击率预测中的候选项隐式用户感知模型

178 浏览量更新于2023-11-29 收藏 1.41MB PDF 举报

搜索引擎

神经网络

身份认证购VIP最低享 7 折!

30元优惠券

246搜索广告点击率预测中基于候选项的隐式用户感知模型Kaifu ZhengZheng，Lu WangZheng，Yu Li†，Xusong Chen，Hu Liu，Jing Lu，Xiwei Zhao，Changping Peng，Zhangang Lin，Jingping Shao{郑开福，王璐241，李玉1078，陈旭松3，刘虎1，吕静12，赵喜伟，彭昌平，林占刚，刘静平}@jd.com业务增长部，JD.com中国北京摘要点击率（CTR）预测在赞助式搜索广告（搜索广告）中起着至关重要的作用。用户点击行为通常在用户意识内的相关/竞争项目之间显示出强烈的比较模式。显式用户感知可以通过用户行为序列建模来表征，但是其存在诸如冷启动、行为噪声和隐藏通道等问题。相反，在本文中，我们研究的问题建模隐式用户意识相关/竞争项目。我们注意到，CTR预测模型的候选项可以充当用户意识内的相关/竞争项的替代物。基于这一发现，我们提出了一个新的框架，名为CIM（候选项建模），来描述用户对候选项的感知。CIM引入了一个额外的模块来将候选项编码到上下文向量中，因此对于现有的基于神经网络的CTR预测模型来说是即插即用的。在一个百亿规模的生产数据集上进行的离线实验，以及相应的在线A/B测试，证明了 CIM 的优越性能。值得注意的是， CIM 已经在www.example.com上进行了生产JD.com，服务于数亿用户的主要流量，显示出巨大的应用价值。我们的代码和数据集可以在www.example.com上https://github.com/kaifuzheng/cim。CCS概念• 信息系统→赞助搜索广告;计算广告;·应用计算→在线购物;·计算方法学→神经网络。关键词搜索引擎，推荐系统，网络广告，点击率ACM参考格式：Kaifu Zheng，Lu Wang，Yu Li，Xusong Chen，Hu Liu，Jing Lu，Xiwei Zhao，Changping Peng，Zhangang Lin，Jingping Shao.2022年搜索广告点击率预测的候选项隐式用户感知模型在4月25日至29日举行的ACM Web Conference 2022（WWW '22）会议上，平等贡献。[2]通讯作者。本作品在知识共享下许可署名-非商业性使用-禁止演绎国际4.0许可协议。WWW©2022版权归所有者/作者所有。ACM ISBN978-1-4503-9096-5/22/04。https://doi.org/10.1145/3485447.35119532022，虚拟活动，里昂，法国.ACM，美国纽约州纽约市，10页。https://doi.org/10.1145/3485447.35119531引言在线广告，如搜索广告和展示广告，是搜索引擎、电子商务平台、社交网络等最重要的商业模式之一。每次点击成本（CPC）或每次点击付费（PPC）是一种广泛使用的在线广告模式，其中广告商为用户点击其赞助项目支付费用。利用这种机制，广告平台有必要估计每个候选项目的点击率（CTR），然后选择一个项目进行显示，以便最大化预期收入。个性化、精准的点击率预测不仅有利于最终收入，还能提升用户体验和满意度。在线广告中的CTR预测通常基于用用户的观看和点击行为的历史数据训练的统计机器学习模型。此类统计模型的示例包括逻辑回归[11]、基于树的模型[22，52]和神经网络[33，47，66]。当在典型的在线广告场景中服务时，CTR预测模型导出候选项的集合每个候选项目将被分配一个排名分数，同时考虑pCTR（预测CTR）和投标价格。具有较高排名分数的项目具有较高的概率被暴露给用户。用户点击行为通常表现出强烈的比较行为，特别是在给定用户的个性化意识内的竞争/相关项目之间。例如，比其竞争项目经济得多的赞助项目（或享有某些其他区别性的亮点）显然更有可能被点击;相反，不太有特色的项目很难吸引用户的注意力，因此不太可能被点击。请注意，只有当用户意识到有区别的突出显示时，比较模式才会起作用-如果用户对竞争项目一无所知，肯定不会有意义的比较模式。因此，目标物品的相对定位，即，在用户意识内的竞争/相关项目中，要预测的项目可以是CTR预测的强模式。图1（b）显示了一个直观的例子。用户行为序列建模可以被视为一种捕获比较模式的方法[4，14，46，65，66]。动机显然是直观的-在目标项目和用户之前查看/点击的项目之间存在直接的比较，这自然在用户意识内;因此，顺序用户行为数据可以用作显式比较上下文并对CTR产生深远影响。尽管在实践中取得了成功，用户行为序列建模仍然存在一些固有的局限性。一方面，它经常遭受冷启动WWW郑开复，王璐，李宇，等.247亿万检索亿万检索换句话说，我们把这些候选项作为建模隐式用户意识的原始材料。相关性过滤（一）（b）第（1）款查询：空调（Airconditioner）目标项目：品牌-A景芝壁挂式空调￥26991.5pi /Inverter预排名排名CTR预测我们提出了CIM（候选项建模，整体架构见图2），CTR预测框架，从候选项中捕获比较模式，从而隐式地模拟用户对竞争/相关项的感知。为了进一步表征用户的个性化感知，在预测阶段的开始构建子模块Select，预测用户“感知”每个候选项的概率。然后，CIE（候选项编码器）模块将候选项的集合与Select的输出一起编码为上下文向量。CIE受Transformer架构[54]的启发，对候选项具有置换不变性，并表征跨项交互，以便有效地捕获比较模式。最后，主干模块基于上下文向量输出预测的CTR。值得注意的是，骨干可以简单地通过改造现有的最先进的CTR预测模型来实现;换句话说，我们的CIM框架可以增强广泛的图1：（a）工业搜索广告引擎中的典型级联架构。上游检索和相关性过滤确保候选项与查询高度相关(b)直观地说明了我们关于比较模式和用户意识的想法。当搜索对于目标商品“品牌-A景芝”，目标商品与具有相似价格和属性的商品之间的比较（其更可能在用户认知范围新用户/兴趣情况下的问题[5，42]，其中用户的行为序列不包含与目标项目竞争/相关的任何项目-用户行为序列中没有有意义的另一方面，当用户行为序列的长度增加时，序列中的大多数项目可能与目标项目无关-难以从噪声序列中精确捕获目标项目的比较模式，即，噪音问题[34，37]。此外，我们注意到，比较模式不一定源于用户在在线广告平台上直接感知的上下文。事实上，用户可以从各种渠道接触竞争/相关项目，例如，在其他线上平台甚至线下场景中。由于在线广告平台可能无法访问这些数据，因此CTR预测模型无法从用户行为序列中捕获这些比较模式我们把这个问题称为隐藏通道问题。在本文中，为了解决上述挑战，我们研究了通过利用搜索广告的业务特性，以隐式方式在搜索广告场景中，为了确保用户体验，CTR预测模型的所有候选项必须与查询相关，这通常由上游相关性模型[21，39]过滤掉所有不相关项来保证，如图1（a）所示。受此观察的启发，我们建议利用这些候选项作为用户可能具有先验知识的竞争/相关项的替代物;多种CTR预测模型已投入生产，显示出很大的应用价值。值得强调的是，我们提出的CIM特征比较模式从一个新的角度来看，是正交的用户行为序列建模。我们进行了大量的实验来验证CIM值得注意的是，CIM额外地需要可查询项的集合，而传统的CTR预测数据集不包含这样的上下文信息。相反，我们在公共数据集上的实验部分模拟了学习排名数据集。此外，我们在现实世界工业场景中的实验主要基于全球最大的电子商务平台之一京东的搜索广告系统我们从实际流量中收集了一个百亿级的生产数据集，其中包含每个请求的可访问项（暴露项）的集合为了方便进一步的研究，我们还发布了一个轻量级和匿名版本的数据集，以及我们的代码。实验结果表明，CIM可以显着和一致地提高性能的各种基线CTR预测模型在所有的数据集。此外，我们已成功将CIM部署在上述京东搜索广告系统的生产中。在我们精心设计的大规模在线A/B测试中，CIM带来了CTR 1.81%和RPM 2.88%的改善，- 是的从那时起，CIM一直为主要交通提供服务概括而言，我们的主要贡献如下：据我们所知，我们是第一个在用户对竞争/相关项目的认知捕捉隐含比较模式的公司，也是第一个直接为搜索广告中的CTR预测建模的公司我们建议CIM模型的比较模式，在一个隐式的方式，通过利用候选项。它是一个通用框架，能够提高各种现有CTR预测模型的性能。我们发布了一个大规模的工业数据集，记录了每个暴露项目的候选项目集，以促进在这个新方向上的进一步研究CIM已成功部署到生产一线，服务于交通干线，显示出巨大的应用价值。品牌A云家壁挂式空调￥29291.5pi /Inverter品牌-B壁挂式空调￥24991.5pi /Inverter在用户意识范围内比较模式Brand-C支架空调￥59992 pi/逆变器品牌-A云逸站空调￥57993 pi/逆变器在用户意识之外比较模式候选项目····搜索广告点击率预测中基于候选项的隐式用户感知模型WWW248图2：所提出的CIM框架由三个组件组成：（1）选择子模块（左）对每个候选项进行评分，指示用户意识到每个项的概率;（2）CIE（候选项编码器）模块（中），利用由选择引入的归纳偏差，将候选项集合编码成上下文向量;（3）骨干模块（右）基于上下文向量输出预测的CTR。2相关工作在本节中，我们回顾了以前关于CTR预测和学习排名的研究。2.1CTR预测点击率预测是在线广告和推荐系统的关键任务之一点击率预测模型的准确性对在线性能有很大的影响，引起了业界和企业的目前的CTR预测方法通常设计以下三个典型的范式：特征表示，特征交互和损失函数。许多作品[10，18，33，43，52]试图通过将更多信息纳入模型来改善用户或项目的特征表示在这些工作中，用户行为建模是其中最重要的分支之一，与我们的工作密切相关用户行为是高度个性化的，反映了时空用户的兴趣。早期的工作集中在使用不同的神经网络架构（如CNN [50，61]，RNN [65]，Transformer[17，48]等）学习潜在用户兴趣的表示。DIN [66]首先引入了注意力机制，以捕获用户对不同目标项目的不同兴趣范围。DIEN[65]和DRN [64]进一步引入序列建模和强化学习来描述用户KFAtt [34]建议使用卡尔曼滤波来克服频繁行为的偏差。SIM[37]和UBR4CTR [40]对长期用户行为进行建模。除了用户兴趣之外，用户行为序列还可以指示用户对相关/竞争项目的意识，如第1节中所讨论的。然而，由于冷启动、行为噪声和隐藏信道问题，这些信息通常是不够的。相反，我们建议通过候选项来建模用户意识。由于候选项引入的信息与用户行为序列正交，因此我们在生产中的复杂基线上获得了额外的性能提升，该基线已多次优化并利用用户行为建模和其他SOTA技术。探索特征交互的方法，例如 FM 、 Wide& Deep 、 DeepCrossing 、 Deep& Cross （ DCN ）、 DeepFM 、 xDeepFM 、Cross-Mix [12，20，31，43，45，57，58]，旨在记忆特征空间和标签空间联合中的共现模式。由于我们提出的CIM是一个独立的特征提取器模块（提取上下文向量），它可以很容易地结合到任何上述模型，以提高整体性能。逐点分类损失，如交叉熵，最常用于CTR预测。随着度量学习[28，56]和学习排名的发展，成对损失[8，25]被引入CTR预测[49]，其采用相对排名监督。它可以自然地用于在训练期间捕获正实例和负实例之间的比较模式，通过在正实例和负实例之间建立辅助成对损失我们在实验中证明了我们提出的方法也与成对损失兼容（见5.4节）。在本文中，我们提出了隐式模型的用户意识从候选项集预测他们的印象概率。据我们所知，我们是第一个在CTR预测任务中对候选项进行建模的公司。此外，如上所述，我们的方法与几乎所有当前SOTA CTR预测方法正交，并且通过简单的即插即用引入性能提升。2.2学习排序搜索广告场景中另一个密切相关的任务是学习排名（LTR）。学习排名算法旨在应用机器学习技术来解决排名问题[2，6，8，9，18，25，60]，其已应用于各种排名任务，如Web搜索[24]，推荐[15]，电子商务搜索[26]。大多数传统的LTR方法遵循单变量评分范式，根据每个项目的特征向量独立地计算每个项目的排名分数。上下文感知LTR模型被提出来基于它们的上下文（即，候选集中的其他项目），它将多个项目一起作为输入，并联合预测它们的最终排名得分[2，3，35，38]。例如，SetRank [35]是X（|C|）ii2Kx（2）x（1）ii2K ii2K选择子模块yIKT（|C|）iKTyIKT（|C|）中国（2）IKT中国（1）IKT⨂⨂⨂⨂⨂⨂⨂y （一）y （一）yIKT（|C|）`+Hi+FTransformer编码器c（i）MLP骨干架构Transformer解码器（xmb2`，x[m2`v）x（|C|）ii2K（一）（一）CIE模块xii2Kxii2K骨干模块CIM框架选择选择选择选择选择选择选择（xmb2`，x[m2`v）WWW郑开复，王璐，李宇，等.249项目项目[]∈项目∅∈∈Imp项目Imp项目Imp项目项目θ∈Θ项目|（x，y）∈ D|(x,y)∈D激活函数，并且使用标准的logistic sigmoid函数将输出缩放到0， 1提出通过模型捕获查询中的局部上下文信息-目标项，在候选项集合中，跨项目交互。已经表明，CTR预测方法可以容易地应用于LTR，例如，通过预测y（i）=fθ （x用户，x查询，x（i）），C），i ∈ [|C|]中。（三）CTR作为排名分数[49]。因此，我们提出的CTR预测方法CIM也可以很容易地扩展到上下文感知的LTR略有修改。我们的实验表明，CIM的优越性SOTA上下文感知LTR方法SetRank，我们提出的CIM框架的总体架构如图2所示。该框架主要由三个部分组成：选择子模块、候选项编码器模块和主干模块。CIE模块将这进一步表明了CIM的普遍性（见第5.5节）。候选项C连同目标项x（i）一起到上下文3预赛CTR预测模型可以形式化为函数fθ：X→向量c（i），而选择子模块引入归纳偏置以在该编码过程期间进一步捕获用户意识。骨干模块可以简单地通过改造其中X表示输入空间，并且Θ是模型的参数空间广泛的现有深度神经网络CTR预测模型。除了普通CTR预测模型的输入，即，在搜索广告的场景中，输入空间通常包含来自用户、项目、查询以及其他相关上下文的特征xuser，xquery和x（i），Backbone也采用上下文向量c（i）（i）.也就是说，X = X用户× X查询× X项目× X上下文。当在线服务时，CTR预测模型将被给予请求（x用户，x查询）∈作为附加输入;然后输出预测的CTR，即，y4.2子模块：选择X用户×X查询，候选项列表C={x（i）}|C|哪里（一）项目i=1选择是CIE的一个子模块它用于从x项X项，以及上下文特征x上下文Xcontext（可选，换句话说，我们可能有Xcontext =）。然后利用该模型预测每个实例的CTR用户可能知道的候选集，并为CIE模块引入归纳偏差，即这些项目在建模隐式上下文时扮演更重要的角色y∈（i）=fθ（xuse r，xque ry，x（i），x∈ ex t），|C|]、（1）包含在候选项中具体来说，Select计算一个项目并且将选择具有最高预测CTR的项目，每个候选人的impressionpossibility，或seleprosscore，y（j）暴露给用户。1项目x（j）给定请求（x用户，x查询）：CTR预测模型的训练集是从印象的日志（即，暴露的项目和对应的点击反馈）构建的设D∈（X×{0，1}）n表示训练集;对于任何（x，y）∈D，y（j）其中，=Select（xuser，xquery，x（j））），j ∈ [|C|]、（4）标签y指示是否点击实例xCTR预测模型通过解决以下优化问题来训练：最小值L（D;θ）1.（y，fθ（x））yimp∈（0，1）.然后，CIE模块在计算上下文向量时利用印象概率来平衡候选项的权重Select可以是一个简单的多层感知器，使用ReLU作为（）下一页其中R：{0， 1} × [ 0， 1] →R是损失函数。4建议的算法：CIM正如我们在第1节中强调的，用户点击行为在竞争项之间显示出强烈的比较模式;此外，候选项可以反映竞争项的特征分布，因为在搜索广告场景中，所有候选项都与查询相关，通常由上游相关性过滤器保证。为了确保Select按照我们的要求作为印象预测器，我们在整个搜索会话中利用印象作为辅助监督。y∈（i）上的相应损失函数φim p（·，·）将在S ∈4.5中进行解释。4.3模块：CIECIE（Candidate Items Encoder）模块是CIM框架的核心组件它将候选项C的集合编码为为了捕捉竞争项目的特征分布每个候选项x（i）的上下文向量（用于在候选项集所包含的用户感知的基础上，提出了一种新的CTR预测框架--CIM（CandidateItemModeling），它直接对候选项集进行下游模块）：c⑴=CIE（x⑴）项目，C，xuser，xquery），i ∈ [|C|]、（五）4.1CIM概述我们提出的CIM框架将候选项集作为CTR预测模型的附加上下文特征，即，其中xuser和xquery仅由Select子模块使用。由于CIE的目标是编码候选项集，因此CIE的输出（上下文向量）不应随候选项目的顺序而改变Xcand= X|C|X = X用户× X查询× X项目× X查询。2当换句话说，上下文向量应该是置换不变的在线服务，模型预测每个实例x（i）的CTR[1]为了简单起见，我们假设所有的项目都有相同的出价。[2]为了清晰起见，我们省略了所有其他的上下文特征WWW郑开复，王璐，李宇，等.250，也就是，关于候选项。此外，CIE还应该表征候选项之间的跨项交互，特别是目标项与其他候选项之间的交互，以便捕获比较模式。251项目项目项目Imp项目∈[]∗∈{}∈（）∈（×{}）Lins（x，y; θ）（1 − η）click（y，y）+|C|imp（yimp，y（九）θ∈Θ|（x，y）∈ D|(x,y)∈D4http://labs.criteo.com/downloads/2014-kaggle-display-advertising-challenge-数据集换句话说，我们共同培训CIM的所有模块5 https://www.kaggle.com/c/avazu-ctr-prediction隐式用户意识建模通过搜索广告CTR预测的候选项WWW'22，2022年4月25日至29日受集合学习[62，63]和自我注意机制[13，32，36]的最新进展的启发，我们在Transformer [54]架构的基础上构建了CIE具体来说，Transformer编码器推导出所有候选项的加权嵌入其权重是Select返回的选择分数;然后将输出传递给Transformer解码器。连同表1：BMPCTR-Pub和BMPCTR-Pro数据集的统计数据#平均值的计算方法是将#平均值除以#用户查询组。Bil是Billion的缩写。目标项目x（i）上下文向量c（i）。，Transformer解码器输出最终4.4模块：主干骨干模块是预测CTR的重要组成部分它接受请求（xuser，xquery）和一个候选项x（i）以CIE返回的相应上下文向量c（i）作为输入，并输出结果CTR预测y（i）：y∈（i）=Back b one（xuse r，xque ry，x（i），c（i）），|C|]中。（六）骨干模块可以通过改造现有最先进的CTR预测模型来实现[20，31，57]。在我们的实现中，我们简单地将c（i）与vanillaCTR预测模型的倒数第二层的输出连接起来，并相应地调整其最后一层（通常是全连接层）以匹配连接向量的维度4.5目标函数CIM的监督信号来自两个来源-点击（暴露的项目是否被点击）和印象（候选项目是否被暴露）。点击监督鼓励对CTR的准确预测，并且印象监督指示选择子模块选择可能暴露给用户（在用户意识内）的重要候选项。给定一个记录的实例（x，y）∈X× {0， 1}，其中x=（xuser，xquery，xitem，C），（7）我们的CIM模型在这个实例上的输出是5实验在本节中，我们想回答以下问题：(1) CIM如何在不同的数据集上强化不同的CTR预测基线？(2) CIM的每个模块是如何执行的？(3) CIM的通用性如何为了进行公平比较，所有比较方法都使用TensorFlow 3实现，并在NVIDIA Tesla P40 GPU上运行。所有的分类特征都被转换为16维嵌入。编码器和解码器都是1层Transformer，尺寸为80，头数为4。我们设置超参数η = 0。5. 采用Adam [27]优化器进行训练，其学习率为0。001.5.1数据集由于Criteo4和Avazu5等公共CTR预测数据集不包含每个实例的候选项集，因此我们无法在这些实验台上进行实验y=fθ（xuser，xquery，xitem，C）;（8）标记.因此，我们收集了两个真实世界的工业数据集，被称为PICCTR-Pub和PICCTR-Pro，从主要的交通，这种情况下的损失定义为η .|C|j=1（十）（十）全球最大的电子商务平台之一京东的赞助搜索广告系统。PXCTR-Pub是一个轻量级的，其中y（j）指示x（j）是否暴露给用户，并且离线实验和烧蚀研究的ESCTR-Pub;我们还可以显示离线结果的ESCTR-Pro及其相应的η0， 1是平衡两种损失的超参数在我们的实现中，我们利用交叉熵损失的点击和imp ression支持视觉，即。例如，两个循环k（·，·）和循环p（·，·）具有相同的形式（ y ， y′ ） −ylog （ y′ ） − （1−y ）log（1−y′），（ 10）其中y0， 1且y′0， 1。最后，给定训练集D X0， 1，我们的CIM模型通过以端到端的方法解决以下优化问题来训练在线A/B测试结果此外，我们从公共学习排名数据集MSLR 10 K[41]中仔细构建了一个数据集MSLR 10 K-Candi，以模拟我们的应用场景。由于篇幅所限，有关MSLR 10 K-Candi及其实验结果的详细信息，请参阅附录A。Pakistan Pub. 由于公共可用数据集的限制，我们从一个最大的电子商务平台之一的搜索广告系统中构建了一个搜索日志数据集。我们从在线搜索日志中随机抽取一个子集，并将训练集和测试集按日志时间进行分割，以保证数据的分布最小值Lse t（D;θ）1.在s（x，y;θ）中的L为零。（十一）3https://www.tensorflow.org/匿名版本的ESCTR-Pro，我们使其公开，能够促进进一步的学术研究。我们进行主要的财产电子邮件公司简介火车测试火车测试联系我们5,189,5251,118,42010亿1M#用户查询组1,014,182223,44920亿0.2M联系我们323,47864,32320M30k用户数931,883180,1460.2Bil100k项目数量15,587,268 7,135,05430M1M#分类3,3352,7454k2k#品牌88,21980,567100k20k供应商数量103,83298,715100k20k平均数量5.1175.0054.644.58252±. .±∼∼WWW表2：在PICCTR-Pub数据集上的实验结果。每个实验独立重复5次（平均标准差）。CI表示通过Transformer直接合并候选项，而不包含Select子模块; SM表示包含Select子模块。↑表示数字越大越好;↓表示数字越小越好。号基线CI SMAUC↑AAUCLogLoss↓对数损失GAUC↑GAUC（一）DNN0.6176±0.00030.2554±0.00000.5300±0.0005（二更）DNN✓0.6220±0.0005+0.00440.2547±0.0001-0.00060.5339±0.0004+0.0039（三）DNN✓ ✓0.6349±0.0007+0.01730.2544±0.0001-0.00090.5500±0.0004+0.0200（四）xDeepFM0.6193±0.00010.2551±0.00000.5318±0.0002（五）xDeepFM✓0.6215±0.0003+0.00220.2548±0.0001-0.00030.5338±0.0006+0.0020（六）xDeepFM✓ ✓0.6360±0.0002+0.01680.2544±0.0001-0.00070.5499±0.0001+0.0181（七）DCN0.6197±0.00020.2547±0.00000.5313±0.0004（八）DCN✓0.6240±0.0002+0.00430.2544±0.0000-0.00020.5358±0.0003+0.0045（九）DCN✓ ✓0.6352±0.0006+0.01550.2543±0.0001-0.00040.5496±0.0003+0.0183（十）CrossMix0.6178±0.00010.2553±0.00000.5297±0.0006（十一）CrossMix✓0.6240±0.0003+0.00620.2547±0.0000-0.00060.5351±0.0004+0.0054（十二）CrossMix✓ ✓0.6355±0.0001+0.01770.2543±0.0000-0.00100.5503±0.0003+0.0206与在线环境类似数据集中的每个实例都包含一个用户、一个查询、一个目标项、点击标签、对应的候选项，以及指示候选项是否已暴露的标签每个候选人列表的长度约为300。每个项目都与相应的<品牌ID、类别ID、供应商ID>。所有的项目、用户和查询都用唯一的匿名 ID 表示，以保护隐私。我们的数据集可在https://github.com/kaifuzheng/cim上公开获取。统计数据显示在表1的中间区域。- Pro。真正的生产数据集是一个完整版本的PICCTR-Pub。我们在前32天使用完整的日志进行训练，并从第二天开始抽取100万个实例进行测试。我们省略了详细的描述，因为它类似于PSDCTR-Pub数据集。统计数据见表1右侧区域。我们的PICCTR-Pro的体积比PICCTR-Pub大约2,000倍，这带来了更多的挑战。5.2评估指标对于离线评估，我们采用AUC，LogLoss和GAUC作为我们的指标。 AUC（ROC曲线下面积）[16]是CTR预测最重要的离线评估指标，可衡量全局成对准确度，在大多数情况下与在线性能一致。此外，我们根据查询和用户ID对实例进行分组，并使用GAUC（Group AUC）来评估每组中局部成对准确性的整体性能：5.3多个基线的离线结果由于我们提出的CIM模块是即插即用的，因此我们在3个经典基线上进行了实验：DNN，xDeepFM [31]和DCN [57]，以及最近的最先进方法CrossMix [58]。详细的网络架构如下：DNN：一个3层MLP（多层感知），大小为256- 128-1，带有ReLU。xDeepFM：深度部分与DNN相同，CIN部分的大小为{128，128}。DCN：3层，深部同DNN。CrossMix：专家数为3，交叉层深度为3，低等级交叉层等级为16，深度部分与DNN相同。请注意，为了保护用户隐私，用户行为信息不包含在PICCTR-Pub中。因此，几种流行的方法，如DIN [66]，DIEN [65]和DRN [64]，对用户进行建模，对于CSCTR-Pub是不可行的。尽管如此，我们在第5.4节中表明，我们提出的CIM引入的改进实际上与在线A/B测试实验中的用户行为建模兼容，其中基线模型已经多次高度优化，并利用各种技术仔细建模用户行为。主要结果。结果示于表2中。“CI”表示直接通过Transformer合并候选项，而不使用SelectGAUCG0=1 长度<$×AUC<$（十二）子模块;=G0=1、长度<$选择子模块。为了说明改进的显著性，我们进行了t检验，每个实验重复5次其中G是组的数量，Length<$和AUC<$分别是第<$组中的实例数量和AUCAUC和GAUC都是反映在线性能的强模式还报告由等式10定义的对数损失以指示模型的分类性能对于在线A/B测试，CTR（点击率）和RPM（每千收入）的报告，以显示我们的方法在现实世界的系统（在线性能）的有效性。····253独立地。结果以平均标准差的格式显示将基线模型（1）（4）（7）（10）与它们的CIM对应物（3）（6）（9）（12）进行比较，我们在所有基线和所有指标上获得了显著且一致的性能增益，p值为<0。0001.AUC提高了1.6%~ 1.8%，GAUC提高了1.6%~ 2.1%，表明引入CIM后排序性能得到了很大的改善。同时，分类LogLoss下降0.04%至0.08%，表明模型具有更好的收敛性，搜索广告点击率预测中基于候选项的隐式用户感知模型WWW254图3：通过CIE模块的注意力权重从候选集中选择暴露项目的性能比较，在w/和w/oSelect子模块之间。候选集的大小为300。通过对候选项建模提供的隐式比较模式结果验证了我们提出的CIM的有效性合并候选项的效果。如第1节所述，候选项反映了当前查询下的用户意识。将模型（2）（5）（8）（11）与其基线（1）（4）（7）（10）进行比较，可以看出，尽管AUC和LogLoss得到改善，但与也结合了Select子模块的模型相比，改善非常有限;辅助度量GAUC略有波动。一个可能的原因是，对于冗长且嘈杂的候选项列表，在没有其他监督的帮助下，难以捕获关于竞争项的用户意识。因此，我们得出以下结论：（1）引入候选项有助于CTR预测;（2）直接利用注意力机制对候选项建模不能充分捕捉比较模式选择子模块的效果为了进一步表征用户的个性化感知，提出了选择子模块来选择当前用户可能具有先验知识的项目，然后CIE模块在生成用于CTR预测的上下文向量时会更加关注它们。比较模型（3）（6）（9）（12）和模型（2）（5）（8）（11），我们观察到选择子模块在候选项建模中起着重要作用-它在所有指标上都带来了性能增益。实验结果验证了Select的重要性。Select子模块如何工作？我们进行了额外的实验，以了解拟议的选择子模块是如何工作的，其结果如图3所示。由于CIE模块的注意力权重可以被视为每个候选项对最终上下文表示的贡献，因此我们使用Recall@ k来衡量有多少暴露项被分配了前k个最高注意力权重。在选择子模块的帮助下，明显更多的暴露项被分配有前k个最高的注意力权重，这进一步证实了选择子模块的有效性。比较模式的直观示例。为了更好地理解CIE模块学习的比较模式，我们在图4中的数据集中可视化了3个示例。注意，目标项目和候选项目之间的比较模式可以由CIE解码器的注意力权重来表征;因此，我们通过CIE解码器的注意力权重对候选项目进行排序，表3：在PDXCTR-Pro数据集上的实验该模型在PSDCTR-Pro上进行训练，并在线部署进行 A/B 测试。离线结果在ECHCTR-Pro测试集上进行评估度量基础+CIM+CIM +CIM数据拆分所有所有CS LB线下AUCAAUC0.7631 0.76770.0046 - 0.0046 -0.0046在线企业简介0+1.81%+2.20%+2.10%A/B测试100RPM0+2.88%+3.12%+2.62%视觉化绿框中的项目得分最高，而红框中的项目排名最低。首先，正如我们所看到的，候选项与查询密切相关。其次，得分高的项目通常在品牌、价格范围或属性方面与目标项目具有竞争力和可比性。第三，低分项目与目标项目的相关性明显较低，且往往是不经常接触公众或不被公众普遍感知的长尾项目。更具体地说，考虑以下示例。当我们在电子商务平台上搜索“手机”时，看到商品“Brand-AXperial1”时，我们的点击行为不太可能受到“Brand-EN1”哑手机的影响，但更有可能受到“Brand-BUltra”等竞争商品的影响。这种可视化表明CIE模块实际上已经学习了有价值的比较模式。5.4在线A/B测试我们进一步进行实验，以验证CIM在现实世界的搜索广告系统中的有效性，实验结果如表3所示。在广告系统中，以前的BaseModel服务于数亿活跃用户的主要流量。我们的BaseModel非常强大，并且经过了高度优化。它由复杂的用户行为建模模块组成，结合了各种各样的其他功能，并将成对损失作为辅助损失函数。我们在我们的100亿规模的ARMCTR-Pro数据集上训练模型为了显示AUC和在线指标之间的相关性，我们报告了在ESCTR-Pro测试集上的离线结果和在线A/B测试的结果，它们分别划分了95%和5%的主要流量。这个A/B测试持续了3天; 2380万次请求，Group-B（实验组）的5%流量涉及首先，从在CIMCTR-Pro测试集上的离线实验结果中，我们可以观察到，将CIM（+CIM）结合在一起比基本模型好+0。46个百分点的AUC。值得注意的是，+0。1个百分点的AUC是一个显著的改善，这进一步验证了CIM的有效性。其次，由于CIM的简单性，我们已经成功地部署了这个CIM增强的基础模型在搜索广告系统。在我们的在线A/B测试中，+CIM实现了1.81%的CTR和2.88%的RPM增益。我们想再次强调，这种改进是不平凡的，因为我们的基本模型已经高度优化。从那时起，CIM一直在为数亿用户的主要流量提供此外，除了所有用户的总体结果外，我们还分析了冷启动用户（CS，没有行为的用户）的性能WWW郑开复，王璐，李宇，等.255NDCG@1↑NDCG@5↑NDCG@10↑↑基本模型0.1689[35]第35话我们的0.17950.31460.31720.32450.38220.38650.3931查询目标物品高分考生候选项按CIE解码器排序低分考生激光投影仪（Laserprojector）牛奶（Milk）手机（Mobilephone）Brand-A Cinema2激光放映机￥169994K /2200ANSI品牌-A高端牛奶￥793.6g口服/250 ml品牌-A Xperia 1智能手机￥59995G/4K/游戏Brand-A CinemaPro激光投影机￥134994K /2400ANSI沙漠A品牌高端牛奶￥99全脂/250 ml品牌-A Xperia 1 II智能手机￥69995G/4K/游戏Brand-A CinemaPro激光投影机￥179994K /2400ANSI品牌-梦想高端牛奶￥783.8g po/250ml品牌-B超智能手机￥69995G/2K/游戏品牌-A WeMax One激光投影机￥134991080 P/150寸品牌B高端牛奶￥128200ml品牌-A Xperia 1 III智能手机￥79995G/4K/照片品牌-BVogaPhone投影仪￥206964G/Wifi/Mini品牌-C酸奶￥73流行/原创品牌-C K40智能手机￥21995G/游戏品牌C微型投影机￥58816G/Wifi品牌-D水牛奶￥108学生/纯品牌-D X3智能手机￥1099秒针Brand-D家用投影机￥9891080 P/Wifi/安卓品牌E牛奶￥128高钙品牌-E N1电话￥2394G/老人图4：CIM在比较模式上的直观示例每一行对应于我们数据集中的一个实例，包括查询、目标项和候选项，它们在CIE模块中按解码器的注意力权重排序我们将前3项和后3项分别显示在绿色和红色框中。每个项目图片右侧的文本框显示有关该项目的相应信息这4行分别表示品牌型号类型、类别、价格和属性在过去30天内）和具有前20%长时间行为（LB）的用户CIM为用户行为建模

下载后可阅读完整内容，剩余1页未读，立即下载