通过动态广告分配的整页优化

87 浏览量更新于2023-10-16 收藏 12.76MB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

Track: ORSUM: Workshop on Online Recommender Systems and User Modeling WWW 2018, April 23-27, 2018, Lyon, France14070通过动态广告分配进行整页优化0Weiru Zhang，Chao Wei，Xiaonan Meng，Yi Hu，Hao Wang阿里巴巴集团中国杭州{weiru.zwr，weichao.wc，xiaonan.mengxn，erwin.huy，longran.wh}@alibaba-inc.com0摘要0现代搜索引擎呈现由两种最突出的信息组成的结果页面：赞助和有机搜索结果。整页结果必须满足用户的信息查询，而赞助广告与搜索结果并列已成为该平台的关键变现策略。在这种情况下，一个基本问题受到相对较少的关注：有多少广告足够获得更高的用户满意度和更好的变现效果？大多数搜索引擎总是显示固定数量的广告或使用启发式规则来确定广告数量。在本文中，我们将找到最佳广告数量的任务转化为线性规划优化问题，并提出了一种新颖的在线算法来解决。我们进行了几个离线实验，并在阿里巴巴电子商务平台上测试了我们的方法。实验结果表明，通过所提出的算法，该平台可以同时实现更高的收入和更多的点击。0CCS概念0• 信息系统 → 信息检索；• 应用计算 → 电子商务；• 计算方法学 →机器学习；0关键词0赞助搜索，整页优化，动态广告分配，点击收益率，深度神经网络0ACM参考格式：Weiru Zhang，Chao Wei，Xiaonan Meng，Yi Hu，HaoWang。2018。通过动态广告分配进行整页优化。在WWW'18Companion：2018年Web会议伴侣，2018年4月23日至27日，法国里昂。ACM，纽约，美国，5页。https://doi.org/10.1145/3184558.319158401 引言0当用户搜索一个查询时，搜索引擎返回一个页面，其中包含几个广告，然后是搜索结果。广告和有机搜索结果都是必要的，并为用户提供信息。根据不同的目的，这两种类型的结果分别进行召回和优化。有机结果通常根据相关性或项目对查询的流行度等因素进行排名。广告主可以通过提供高出价在赞助搜索中获得顶级排名，因此广告结果是基于潜在收入确定的。0本文根据知识共享署名4.0国际（CC BY4.0）许可发布。作者保留在其个人和公司网站上传播作品的权利，并附上适当的归属。WWW'18 Companion，2018年4月23日至27日，法国里昂© 2018IW3C2（国际万维网会议委员会），根据知识共享CC BY 4.0许可发布。ACM ISBN978-1-4503-5640-4/18/04。https://doi.org/10.1145/3184558.31915840对于搜索引擎而言，根据每次点击付费（PPC）广告模式，总收入等于点击次数乘以每次点击的费用（CPC）。有多少广告足够？一种直觉是更多的广告可能会带来更高的搜索引擎收入，但可能会影响用户体验。所有搜索引擎面临的一个基本挑战是如何在收入和用户体验之间取得平衡。大多数搜索引擎仍然显示固定数量的广告或使用启发式规则来确定广告数量。本文提出了一种动态广告分配的解决方案，以优化整个页面的性能。具体而言，我们定义了一个新的优化问题，其中涉及整个页面的项目，考虑到点击总数所表示的整个页面的收入和相关性之间的权衡。此外，我们提出了一种基于深度神经网络（DNN）的模型，用于预测总点击次数与总展示次数之比（点击收益率，CY），并考虑到每个项目之间的相互作用。02 相关工作0以往的研究主要集中在分别研究赞助和搜索结果的优化上。已经有很多关于收入优化[2,10]和搜索体验优化[3]的研究。此外，一些研究迄今为止仅限于研究这两种类型搜索结果之间的相互作用。通常，[1, 13, 14,20]中的作者发现有机搜索结果的点击对赞助广告的点击具有互补效应，而[8,19]中的作者则根据查询的分类研究了广告的感知有用性与其与有机结果的文本相似性之间的关系。[8]中的结论表明，对于导航查询，广告和有机结果之间存在明显的竞争关系，而对于非导航查询，竞争关系转化为协同作用。在人机交互领域提出了一个通用的呈现优化框架来评估用户的满意度[17,26]。这些发现使我们能够更好地理解赞助和有机结果之间的关系。我们将整页优化问题定义为一个新的分配问题，它扩展了[23]提出的在线广告分配问题。传统的广告分配问题包括显示广告分配问题[2, 5,9, 12, 28]和AdWords问题[6, 18, 21,29]。此外，视频广告分配问题的在线算法[24]扩展了广告拍卖分配框架[15]。在这些问题中，在线请求必须分配给广告库存，以优化分配的总收入，同时遵守预先指定的合同。其他相关工作中的一些[29]提出了一个权衡排序模型，以向用户提供高质量的广告并最大化搜索引擎的收入。广告数量预测仅在广告领域进行了初步讨论[16, 25]。max(2)βis.t.∀i, j, βi ≥ REVij + α ·iT)α ≥ 0(3)2:J ← ∅3:AAdRetrieveRank i6:J ← J ∪ [A(1),A(2), ...,A(k),O(1), ...,O(N − k)]7:end for8:for j ∈ J do9:CYij = predictCY(i, j)10:REVij = predictREV (i, j)CYij =ctrijn(4)Track: ORSUM: Workshop on Online Recommender Systems and User Modeling WWW 2018, April 23-27, 2018, Lyon, France140803 基础知识0本文研究了优化有机项目和赞助项目的显示数量的问题。需要在整页项目的收入和相关性之间进行权衡，这可以通过总点击次数来衡量。我们将问题定义为一个分配问题，通过最大化预期收入和点击收益约束来优化。03.1 点击收益0与个体点击率（ctr）相比，我们使用[27]提出的点击收益的概念。给定一个特定的请求i和表示页面分配的列表j，j包含包括广告和有机结果在内的N个项目，j = {j1, j2, ...,jN}。点击收益是所有项目的总点击次数与总曝光次数的比率：0CYij =0� N n = 1 Click(i,jn)0Imp(i,j)(1)0点击收益衡量了列表的整体性能，必须考虑到一些挑战，包括广告深度效应、交互影响而不是单个广告或有机结果。03.2 问题定义0根据CY的定义，我们将整页优化问题形式化如下：0i, j REVij ∙ xij0s.t.0� i, j CYij ∙ xij � i, j xij≥ T,0� i，�0j xij = 1,0� i，j，xij ≥0对于每个请求i和排名列表j，我们让REVij和CYij分别表示页面的预期收入和整体点击性能，而j被分配为返回给请求i的列表。该问题定义旨在找到最大化收入的分配计划xij，同时满足平均CY约束T。xij是一个二进制变量，如果j被分配给请求i，则等于1，否则为零。每个请求只能选择一个结果列表，因此我们设置� j xij =1。其对偶问题可以写成如下形式：0minimize0参数α自然地出现作为全局离线线性规划中对平均CY施加下界的约束的对偶变量。它可以解释为整个页面的收入和点击率之间的权衡。此外，对偶问题可以通过线性规划包来解决，α将在第4.1节的在线排名算法中使用。β是阴影收入。04 方法 4.1 实时算法0受Chen等人的工作[5]启发，我们开发了一种新的实时算法，通过动态地改变每个请求的广告数量来解决带约束的收入最大化问题。在线算法称为K-Algorithm，如算法1所示。0算法1 实时K-Algorithm0输入：α，N输出：x i j，k01: 对于来自在线流的请求i04: O ← OrganicRetrieveRank ( i )012: j ′ ← argmax j ∈ J ( REV i j + α∙ CY i j )014: x i j = 0 , � j ≠ j ′0对于一个传入的请求i，分别检索和排名赞助广告和有机物品的候选集。然后通过将前k个广告与前N-k个有机物品连接起来生成一个返回列表（第6行）。k是决定每个特定请求i的最终排名列表j的广告数量。在这种情况下，当k=0时，j是一个没有广告曝光的物品列表。值得注意的是，组合形式并不总是固定的，而是取决于页面布局的前k个广告布局。然后我们计算每个印象（i，j）的CY i j和REV ij，这将在第4.2节中介绍。我们将请求i的每个排名列表j与REV i j + α∙ CY i j（REV i j + α ∙ (CY i j −T)的简化形式）的值进行比较，选择具有最大值的j（第12-14行）。输入α可以通过方程（3）提前使用离线搜索日志数据计算出来。04.2 预测CY和REV0显然，CY和REV在算法中起着关键作用。为了保证算法的效率，我们尽可能准确地估计它们。在本小节中，我们讨论两种不同的估计方法。04.2.1求和方法。当前的广告投放策略通常预测每个项目的ctr并忽略不同项目之间的相关性。一个直观的解决方案是直接将每个项目的ctr相加，如下所示：0N∑ctrijn = P(e|n) · P(c|i, jn)(5)REVij =rpmijn =ctrijn · clkpriceijn(6)li+1 = f (W ili + bi)(7)14090其中，ctr ijn是第i个请求中第j个列表中第n个项目的估计点击率。此外，考虑到位置偏差，我们使用检验假设[4, 7,11]来估计CY。检验假设认为用户更有可能点击排名靠前的项目，而不太可能查看排名较低的项目，这表明每个排名都有一定的被检查的概率。这个概率用P(e|n)表示，ctr ij n的表达式如下：0P ( c | i , j n ) 是 j n 是请求 i 的结果 j的元素的点击率。类似地，我们有 REV i j ：0N×0N×0REV i j取决于拍卖模型。在按点击付费的广告模型下，总收入是点击次数乘以每次点击的费用。此外，搜索引擎承诺使用广义第二价格（GSP）拍卖机制[22]来确定每个广告主应支付的费用。当列表j固定时，我们可以使用预期点击率和实际点击价格来计算每次展示的预期收入。对于有机物品，clkprice设置为零。04.2.2交互式方法。估计CY比估计单个项目ctr更复杂。Sum方法易于实现位置偏差，但它不考虑额外因素：项目之间的交互影响，特别是赞助广告和有机物品之间的交互。两个在预测个体绩效上具有相似精度的系统在群体绩效上可能非常不同[27]。因此，我们将寻找一个模型来捕捉这种交互。在这里，我们想使用DNN来预测CY和REV。DNN是一个前馈神经网络，网络的每个隐藏层定义为：0其中i是隐藏层编号，f是激活函数（如ReLU，Sigmoid）。li，bl和Wi是第i层的激活值向量，偏置向量和模型权重。输入特征包括多种信息，如性能（估计ctr，估计每次展示的收入（rpm），项目信息（价格，类别，类型（广告或有机物品）等）和上下文信息（附近项目的信息）。特征和参数设置的详细信息将在5.2中介绍。05 实验0在本节中，我们进行全面的实验来验证所提出的算法。离线模拟基于来自阿里巴巴的点击日志数据，该网站是目前全球最大的跨境B2B电子商务网站。我们还在阿里巴巴电子商务平台上运行在线A/B测试，使用4.2.1中描述的Sum方法。在第5.2节的最后部分，与Sum方法相比，交互式方法在点击产量预测方面显示出更高的准确性。05.1 离线模拟0我们构建了一个离线模拟平台，并重放请求流。我们使用了2017年9月从阿里巴巴移动端收集的一个星期的日志数据，其中包括赞助广告和有机物品。经过过滤的数据覆盖了770万个请求。每个请求对应一个候选集，其中包含最多十个广告和二十个有机物品。基线是页面顶部最多五个广告的固定设置，其余是有机物品，与在线设置保持一致。请注意，由于某些指定请求可能没有足够的候选广告，广告的平均展示次数（ASN）可能少于五个。05.1.1 参数 T的解空间。我们的实证研究集中在控制两个核心关键绩效指标（KPI）：CY和REV。第3.2节中定义的线性规划问题（2）表明，约束T（平均CY）确定了分配计划（每个请求的K个广告）和总体最大收入，这表明参数T能够将收入KPI稳定在给定的参考值上。换句话说，我们可以将T控制器作为一种收入优化工具，并通过搜索T的参数空间来研究收入优化的性能。由于线性规划的性质，收入优化问题是T的单调递减函数。此外，考虑到我们想要使这两个KPI更好（或至少不更差），参数T肯定有上下限。显然，下限T lower 是基线的平均CY。而Tupper表示T的上限，它产生与基线相同的收入。图1显示了参数T对控制收入的曲线。图1中的红点是基线，每个请求固定设置为五个广告。从结果中，我们可以看到区间（T lower ，T upper）是我们的两个核心KPI的解空间。0图1：不同CY约束下的总体收入改善。所有测量值均相对于基线计算。05.1.2参数T调整。在本小节中，我们在解空间中共享参数T调整的离线模拟结果。除了CY和REV，我们还研究了其他几个KPI：平均0Track: ORSUM: Workshop on Online Recommender Systems and User Modeling WWW 2018, April 23-27, 2018, Lyon, France14100图2：在线评估的相对性能0显示赞助广告数量（ASN），广告的平均项目ctr（ctrad），有机结果的平均项目ctr（ctrorд）。由于训练/测试数据是按时间顺序而不是随机分割的，避免了使用未来数据预测过去的问题。我们在测试数据上调整控制器并观察性能。表1提供了每个参数T的详细控制性能，适用于所有KPI。我们还将我们的算法与固定数量策略（Fixed）进行比较。我们在K算法中使用四个不同的参数T设置运行实验。T后面的数字表示相对于基线的平均CY改进百分比，例如T10表示参数T的值是基线的10%改进。0表1：离线模拟的相对性能0ASN REV CY ctr ad ctr org0Fixed4 -16.3% -13.8% 10.2% 10.9% 9.4% Fixed618.1% 8.4% -7.0% -7.2% -6.8% T-5 12.5% 25.1%-5.0% -6.3% -3.8% T0 9.2% 22.5% 0.0% 4.7%-4.2% T5 7.9% 17.4% 5.0% 7.0% 3.1% T10 7.2%10.1% 10.0% 12.3% 8.1%0从结果可以看出，所提出的算法优于固定策略，验证了具有不同参数T设置的K算法的有效性。结果与第5.1.1节中的T解空间分析一致。05.2在线评估0我们在alibaba.com上实现了我们的算法，并在2017年10月的连续六天内的移动端的两个不同渠道上进行了实验。基线是Fixed5，即在线设置。与各种指标的性能比较报告如图2所示。由于数据的敏感性，我们只在这里呈现相对性能。从比较中我们得出以下观察结果：(1)所提出算法的REV和CY都优于基线。T10在CY方面优于T0，而T0在REV方面优于T10。结果与第5.1节中的分析一致。(2)与Fixed6相比，所提出的算法在REV和CY方面都更高。这意味着动态广告分配非常强大，我们可以在不改变广告和有机项目的排名策略或大幅改变的情况下，在CY和REV方面获得显著的改进。0增加广告总数。(3)我们还注意到，实时流量的结果明显少于模拟结果。由于我们使用估计的CY和REV而不考虑交互作用，目标CY(T)和实际CY之间仍然存在差距。我们使用两个隐藏层和ReLU作为激活函数的简单DNN模型，通过4.2.2中描述的交互方法计算CY。特征仅为每个项目的个体ctr。我们将DNN模型与Sum方法进行比较，考虑和不考虑位置偏差。个体ctr由逻辑回归模型生成。表2显示了MSE的比较结果。我们要指出的是，即使网络结构和特征类型非常简单，交互方法的预测结果仍然优于Sum方法。在未来的工作中，将包括更复杂的特征和模型。0表2：CY预测的预测结果0MSE 0.1169 0.1129 0.111606 结论和未来工作0在本文中，我们研究了通过动态广告分配进行整页优化的问题。主要搜索引擎的结果页面包括赞助广告和有机搜索结果的信息。整页结果必须满足用户的信息查询，同时赞助广告与搜索结果一起为搜索引擎带来利润。据我们所知，以前的工作集中于分别研究广告和有机项目的指定目标的优化。我们解决了一个新的优化问题，既最大化搜索引擎收入，又改善用户体验，这扩展了一般的分配框架。在阿里巴巴电子商务平台上的真实数据包括离线模拟和在线评估的实验表明，我们提出的算法在收入和点击率方面都有显著改进。在未来的工作中，我们将研究点击收益和收入的测量，并关注预测排名列表的群体性能，而不是个体性能。将考虑广告深度、整页中不同元素之间的交互等几个因素。0Track: ORSUM:在线推荐系统和用户建模WWW 2018，2018年4月23日至27日，法国里昂14110参考文献0[1] Ashish Agarwal, Kartik Hosanagar, and Michael Smith. 2011. SponsoredSearch:有机结果是否有助于或损害性能，以及在什么条件下？(2011)。[2] Anand Bhalgat,Jon Feldman, and Vahab Mirrokni. 2012. 在线分配平滑交付的展示广告。在第18届ACMSIGKDD国际会议上的知识发现和数据挖掘中。ACM，1213-1221。[3] Fidel Cacheda,Nicola Barbieri和Roi Blanco. 2017.本地搜索结果的点击率预测。在第十届ACM国际网络搜索和数据挖掘会议上的论文集中。ACM，171-180。[4] Olivier Chapelle和Ya Zhang. 2009.用于网络搜索排名的动态贝叶斯网络点击模型。在第18届国际万维网会议上的论文集中。ACM，1-10。[5] Ye Chen, Pavel Berkhin, Bo Anderson和Nikhil R Devanur. 2011.基于性能的实时竞价算法用于展示广告分配。在第17届ACMSIGKDD国际会议上的知识发现和数据挖掘中。ACM，1307-1315。[6] AlexeyChervonenkis, Anna Sorokina和Valery A Topinsky. 2013.在赞助搜索中优化广告分配。在第22届国际万维网会议上的论文集中。ACM，121-122。[7] Nick Craswell, Onno Zoeter, Michael Taylor和Bill Ramsey. 2008.点击位置偏差模型的实验比较。在2008年国际网络搜索和数据挖掘会议上的论文集中。ACM，87-94。[8] Cristian Danescu-Niculescu-Mizil, Andrei Z Broder, EvgeniyGabrilovich, Vanja Josifovski和Bo Pang. 2010.竞争用户注意力：有机和赞助搜索结果之间的相互作用。在第19届国际万维网会议上的论文集中。ACM，291-300。[9] Nikhil R Devanur, Zhiyi Huang, Nitish Korula, Vahab SMirrokni和Qiqi Yan. 2016.具有在线竞标者的整页优化和子模块福利最大化。ACM经济与计算交易，4，3（2016），14。[10] Nikhil R Devanur, Kamal Jain, Balasubramanian Sivan和Christopher AWilkens. 2011.近似最优的在线算法和快速逼近算法用于资源分配问题。在第12届ACM电子商务会议上的论文集中。ACM，29-38。[11] Georges E Dupret和Benjamin Piwowarski. 2008.一种用户浏览模型，用于根据过去观察预测搜索引擎点击数据。在第31届年度国际ACMSIGIR会议上的研究和信息检索开发中。ACM，331-338。[12] Jon Feldman, MonikaHenzinger, Nitish Korula, Vahab S Mirrokni和Cliff Stein. 2010.应用于展示广告分配的在线随机装箱。在欧洲算法研讨会上。Springer，182-194。[13]Anindya Ghose和Sha Yang. 2008.在有机搜索中比较性能指标与赞助搜索广告。在第2届国际数据挖掘和广告受众智能研讨会上的论文集中。ACM，18-26。[14] Anindya Ghose和Sha Yang. 2009.搜索引擎广告的实证分析：电子市场中的赞助搜索。管理科学，55，100（2009），1605-1622。[15] Ashish Goel，Mohammad Mahdian，HamidNazerzadeh和AminSaberi。2010年。广告分配的广义第二定价方案。运筹学快报38，6（2010），571-576。[16] Sreenivas Gollapudi，Rina Panigrahy和MoisesGoldszmidt。2011年。从搜索结果的点击行为推断广告的点击率。在用户建模研讨会论文集中，第四届国际网络搜索和网络数据挖掘会议WSDM。[17] Laura A Granka，ThorstenJoachims和GeriGay。2004年。眼动追踪分析WWW搜索中的用户行为。在第27届年度国际ACMSIGIR信息检索研究和开发会议论文集中。ACM，478-479。[18] Di He，WeiChen，Liwei Wang和Tie-YanLiu。2013年。用于赞助搜索的收入最大化的博弈论机器学习方法。在IJCAI中。206-212。[19] Bernard Jansen和AmandaSpink。2007年。将赞助和非赞助搜索引擎结果组合在一个列表中对点击率的影响。在2007年赞助搜索拍卖研讨会论文集中，WWW会议。[20] Bernard J Jansen和MarcResnick。2005年。研究搜索者对赞助结果的感知和互动。在赞助搜索拍卖研讨会上。[21]Chinmay Karande，Aranyak Mehta和RamakrishnanSrikant。2013年。在搜索广告中优化预算约束的花费。在第六届ACM国际网络搜索和数据挖掘会议论文集中。ACM，697-706。[22] Mervyn King，Jill Atkins和MichaelSchwarz。2007年。互联网广告和广义第二价格拍卖：销售数十亿美元的关键字。《美国经济评论》97，1（2007），242-259。[23] AranyakMehta等。2013年。在线匹配和广告分配。《基础和趋势®理论计算机科学》8，4（2013），265-368。[24] Hanna Sumita，Yasushi Kawase，Sumio Fujita，TakuroFukunaga和RIKEN AIP Center。在线视频广告分配的优化。（？？？）。[25] BoWang，Zhaonan Li，Jie Tang，Kuo Zhang，Songcan Chen和LiyunRu。2011年。学习广告：有足够多的广告吗？知识发现和数据挖掘的进展（2011），506-518。[26] Yue Wang，Dawei Yin，Luo Jie，Pengyuan Wang，Makoto Yamada，YiChang和QiaozhuMei。2016年。超越排名：优化整个页面的呈现。在第九届ACM国际网络搜索和数据挖掘会议论文集中。ACM，103-112。[27] Dawei Yin，Bin Cao，Jian-Tao Sun和Brian DDavison。2014年。估计赞助搜索中的广告组性能。在第七届ACM国际网络搜索和数据挖掘会议论文集中。ACM，143-152。[28] Weinan Zhang，Shuai Yuan和JunWang。2014年。显示广告的最佳实时竞价。在第20届ACMSIGKDD国际知识发现和数据挖掘会议论文集中。ACM，1077-1086。[29] YunzhangZhu，Gang Wang，Junli Yang，Dakan Wang，Jun Yan和ZhengChen。2009年。在赞助搜索中具有相关性约束的收入优化。在第三届国际数据挖掘和广告受众智能研讨会论文集中。ACM，55-60。0跟踪：ORSUM：在线推荐系统和用户建模WWW 2018年4月23日至27日，法国里昂

下载后可阅读完整内容，剩余1页未读，立即下载