目标广告分类：增强在线广告针对性的机器学习技术

69 浏览量更新于2023-12-10 收藏 504KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

⃝可在www.sciencedirect.com在线获取ScienceDirectICTExpress 6（2020）175www.elsevier.com/locate/icte识别用于目标广告分类的机器学习技术Jin-A Choia，Kiho Limb，Choia美国新泽西州韦恩市威廉帕特森大学传播系b美国新泽西州韦恩市威廉帕特森大学计算机科学系接收日期：2020年3月1日;接收日期：2020年4月24日;接受日期：2020年4月27日2020年6月2日在线提供摘要人工智能（AI）技术在在线广告中的应用已经很多，特别是在优化覆盖范围方面。的目标受众。以前的研究表明，提高计算能力显着推进粒度观众定位能力。本研究调查并分类了用于增强针对性在线广告的各种机器学习技术。23种基于机器学习的在线定向广告策略被识别并主要分为两类，以用户为中心和以内容为中心的方法。本文还确定了一个未充分研究的领域，即基于算法的点击欺诈检测，以说明如何整合机器学习方法以保持在线广告的可行性c2020年韩国通信与信息科学研究所（KICS）。出版社：Elsevier B.V.这是一个开放的访问CC BY-NC-ND许可证下的文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。关键词：机器学习;人工智能;目标广告;分类内容1.导言. 1752.目标广告分类1762.1.目标识别1762.2.以用户为中心的办法1762.2.1.行为目标1762.2.2.用户分析1762.3.以内容为中心的方法1762.3.1.联系广告1762.3.2.实时竞价1772.4.点击欺诈1773.广告机器学习技术1773.1.以用户为中心的广告1773.2.以内容为中心的广告1783.3.广告中的点击欺诈检测4.讨论和结论179致谢179竞争利益声明179参考文献179∗ 通讯作者。电子邮件地址：choij21@wpunj.edu（J.A.Choi），limk2@wpunj.edu（K.Lim）。同行评审由韩国通信和信息科学研究所（KICS）负责https://doi.org/10.1016/j.icte.2020.04.0121. 介绍广告实践和策略已被广泛研究，以提高广告在不同目标受众中的有效性[1]。人工智能技术为在线广告创造了竞争优势，2405-9595/2020韩国通信和信息科学研究所（KICS）。出版社：Elsevier B.V.这是一个开放的访问CC BY-NC-ND许可证下的文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。176J.A. Choi和K.Lim/ICT Express 6（2020）175通过提供改进的计算能力来促进数字广告的优化，从而超过传统的实践。基于机器学习（ML）的技术通过基于上下文或预先存在的用户数据预测用户最相关的广告来提高目标定位的准确性[2]。人工智能和数据驱动方法的这些创新有助于减轻广告商面临的挑战，同时显著提升用户体验。各种研究概述了优化定向广告投放的机器学习算法[3]。然而，据作者所知因此，本研究将机器学习技术的各种应用主要分为两类，即以用户为中心和以内容为中心的定向广告方法。另外，识别用于检测点击欺诈的机器学习方法。机器学习技术的详细分类如图所示。1.一、2. 目标广告分类2.1. 目标识别在日益混乱的数字环境中准确预测特定目标受众成员的能力是机器学习所解决的目标广告旨在向消费者呈现最相关的广告信息，[2]基于机器学习的方法允许潜在消费者识别，信息提取和市场细分过程的自动化和优化。将机器学习应用于用户和基于内容的方法比传统的市场细分具有优势，因为个人消费和共享的内容在预测目标受众及其购买行为方面比人口统计和地理数据更重要[4]。例如，用户在各种社交媒体平台（如Twitter）上生成的内容的文本特征可以用于高精度地预测和分类目标受众[5]。此外，个性化的改进和广告信息侵入性的减少有助于提高客户保留率，最大限度地提高营销效率，并提高投资回报率（ROI）[4]。2.2. 用户为中心的方法2.2.1. 行为定位有针对性的广告到达期望的消费者的一种方式是通过行为定向（BT）。为了为消费者选择最相关的广告，BT依赖于历史用户行为，例如从用户的浏览历史中识别点击的链接，访问的页面，搜索和过去的购买随着Google等搜索引擎的普及，在线搜索和网页浏览已经成为两种最常见的在线行为。网络浏览行为有助于广告商对用户的兴趣进行推断利用图1.一、目标广告策略的分类。用户此外，用户预测用户的点击行为是另一种方法以增强针对性广告。每次点击成本（CPC）模型，即广告主在用户点击广告时付费，通常被用作在线广告的常用定价方法。因此，预测用户点击广告的概率，即点击率（CTR），是非常重要的[7]。CTR预测每个显示广告的预期收入以及广告的排名，过滤和放置[8]。赞助搜索（SS）是基于用户搜索查询和广告商识别的关键字之间的匹配放置文本广告例如，当用户搜索由广告商购买的关键字时，然后显示对应的广告。优化广告的自动选择有助于改善用户体验[10]。2.2.2. 用户简档分析用户分析是一种基于行为的方法，是一种推荐系统，它可以发现用户行为中的有用模式，用户兴趣的识别对于根据用户的偏好向用户推荐定制广告是必不可少的。当用户明确地（用户提供的信息）或隐含地（过去的在线搜索、评论、浏览）指示兴趣的分类时，可以根据属性和预定义的类别对他们进行剖析[11]。通过行为定位来区分用户的能力是重要的，因为消息的个性化对于增强用户体验至关重要。2.3. 内容中心法2.3.1. 上下文广告语境广告是广告的另一个重要分支，它描述了广告在J.A. Choi和K.Lim/ICT Express 6（2020）175177第三方网页内容匹配[12]。提供与消费者相关的广告势在必行，因为90%的消费者认为个性化广告具有吸引力，95%的使用个性化策略的公司在广告支出上看到了三倍的投资回报率[13]。网页被实时分析，每次用户访问都会提取关键字，以提供与网页内容密切匹配的广告[14]。当广告与网页内容相关时，它不仅可以增强用户体验，还可以增加点击概率和收入[8]。此外，机器学习方法还解决了广告商错误地将广告与具有敏感或负面内容（例如暴力、战争等）的网页配对的问题，通过检测混合内容页面[12]。如图1所示，在利用以内容为中心的方法的定向广告中还有其他子领域：显示广告是图形化的在线广告。通过在相关网页上适当放置显示广告来增强目标效果[15]。视频广告旨在通过选择在视频中合适的时间和地点满足目标用户兴趣的广告来避免对目标用户的侵入性和无关性，并且与视频中显示的产品一致[16]。根据博客作者表达的兴趣和观点，将博客分配给广告。由于博客可能反映其访问者的兴趣，博客内容和广告之间的强烈相关性创造了个性化的感觉，这反过来又增加了CTR的数量[17]。Web浏览器在单个网页上呈现各种各样的内容。对Web文档进行多主题检查，以避免广告与敏感内容不匹配[12]。车载广告利用导航模块和上下文识别模块来增强上下文感知广告投放。具体而言，车载网络系统收集车载传感器生成的数据并处理信息以提供有针对性的广告[18，19]。2.3.2. 实时竞价通过机器学习的实时竞价（RTB）允许根据从包含有关过去印象，点击，搜索和购买的信息的大型数据集获得的见解，即时决定是否向特定用户显示特定广告[20]。由于RTB交易是实时进行的，因此设计最佳出价算法可以显著提高广告商在策略上对2.4. 点击欺诈欺诈性的在线活动，如点击欺诈，不仅消耗了广告预算，而且破坏了广告的完整性。在线广告行业。点击欺诈发生在非法点击时，其中用户对广告没有真正的兴趣，以获得不诚实的佣金[22]。虚假点击可以使用手动或自动技术在广告上模拟，例如模仿合法用户的自动点击工具或机器人[23]。点击欺诈会严重损害广告客户的投资回报。由于发布商通常通过PPC（按点击付费）付费，广告收到的点击数，点击或展示的膨胀可能会错误地产生。据发现，30%的广告收入被浪费在点击欺诈上[24]。因此，实施点击欺诈检测和预防系统以保持广告商和发布商之间的信任并确保每次点击的合法性至关重要[25]。因此，基于机器学习的点击欺诈检测算法是识别和保护广告商免受欺诈行为的重要工具[23]。3. 广告的机器学习技术在本节中，研究了增强针对性在线广告的各种机器学习技术，并将其分为两类：以用户为中心的方法和以内容为中心的方法。此外，还探讨了几种基于机器学习的检测和/或防止点击欺诈的3.1. 用户中心广告有针对性的在线广告可以通过关键字提取来增强。一种用于从在线广播内容中提取关键词的方法[6]从内容语料库中发现有意义的语言模式，并且所挖掘的模式用于从在线广播内容中提取关键词。为了产生一组候选语言模式，序列模式挖掘（SPM）算法应用于语言模式挖掘步骤。发现的有意义的语言模式用于帮助实时提取关键字为了处理CTR预测，Jiang等人[14]提出了一种称为DBNLR 的深度架构模型，它结合了深度信念网络（DBN）和逻辑回归（LR）。在该模型中，DBN被用来学习用户信息和点击日志的特征和关系，并使用回归模型计算CTR预测的概率值。还提出了用于上下文广告的基于两阶段学习排名方法的CTR预测算法[8]。该算法利用点击请求来构建排名模型，其中广告被排名为列表，并构建回归模型，其中排名模型的预测值通过S形函数转换为CTR。研究了另一种基于深度神经网络的注意机制[19]王世文等著。该方法采用降维方法对相似用户、查询和广告进行聚类，并在降维后建立张量模型。提出了一种用于广告CTR估计的混合模型，称为ASAE，其一起训练深度组件和注意力因子分解机器组件。还提出了一种在线学习算法 [7] ，称为 Follow-The-Regularized-Factorized- Leader（FTRFL），用于CTR预测。·····178J.A. Choi和K.Lim/ICT Express 6（2020）175该方案将具有每坐标学习率的FTRL-Proximal（FTRL-Proximal）算法集成到因式分解机中，与具有随机梯度下降的因式分解机相比，具有更快的收敛速度.在研究中[26]，目标受众的属性，未标注的标识。为了预测年龄，性别和五种性格属性，使用了以下机器学习算法：线性回归，朴素贝叶斯和支持向量机。为了预测个性化广告的客户端配置文件，Bilenko等人[11]提出了一种实用的关键字广告平台解决方案，该解决方案还解决了用户数据的隐私和控制问题。在这个提出的解决方案中，在包括广告点击和印象的用户数据上训练参数化函数以优化效用估计。在模拟简档构建过程之后，从关键字候选的存在中收集真实标签。然后，学习算法试图识别最小化训练集误差的预测器参数。采用三种不同的学习算法对所提出的方法进行了评估，包括最大边缘平均的递归、使用L1和L2正则化的L-BFGS算法训练的逻辑回归和提升的决策树。另一种方法[10]被提出来开发基于代理的转介系统，以通过用户分析来识别用户兴趣。该系统是基于行为的二进制类模型（0：用户不感兴趣，1：用户感兴趣）。在二进制模型方面，使用机器学习来发现潜在的用户兴趣。视乎问题而定，包括项目的性质、服务的具体类型，以及种类和金额可用信息（例如，文档、多媒体或具有附加文本信息），不同的或混合的机器学习算法被用于所提出的方法中的推荐系统。3.2. 以内容为中心的广告为了将相关性与点击反馈相结合，提出了用于上下文广告系统的一类模型[27]。具体地，广告页面评分函数用来自关于广告和网页中的数据的逻辑回归模型的额外参数来增强。回归整合点击反馈和语义信息，从广告和网页，以确定相关性。该方案包括三个步骤：特征提取，特征选择，和系数估计的特征，通过逻辑回归。以博客为中心的上下文广告框架（BCCA）[17]提出了将上下文广告与文本挖掘方法相结合，以根据博客中显示的个人兴趣选择广告，并根据其相关性对其进行排名。该方案由四个模块组成，以找到最佳匹配的广告：（a）意图识别，（b）情感检测，（c）术语扩展，和（d）目标广告匹配。对于页面广告匹配，广告按P（a）排序|q），其中广告的概率A被解释为它与查询Q相关的可能性。Zhang等人。[12]提出了一种在只有页面级别标签可用时学习上下文广告应用的子文档分类的方案。该方案利用MIL（Multiple Instant Learning）-Boost来解决上下文广告中的不同问题。解决的问题之一是敏感内容检测，因此即使不希望的内容发生在网页。解决的另一个问题是从评论网站中挖掘意见，以便可以检测和避免对产品的负面意见。该系统通过提供高质量的块级标签来帮助显著节省时间和成本。提出了一个简单且可扩展的响应预测框架[28]，用于显示广告，以提供简单性，可扩展性和效率。所提出的框架使用最大熵（也称为逻辑回归）和两阶段特征选择算法（特征选择和值选择），以提高自动化程度并减少对领域专业知识的需求。所提出的机器学习框架可以用有限的存储器有效地解决显示广告问题，并且可以扩展到大量的样品和参数。Huang等人[18]介绍了一种用于车辆网络中的上下文感知广告和交付的架构。该架构用作网络设备上的应用程序，并由各种模块组成，包括用于地图数据的导航模块、用于车辆内传感器的上下文识别模块、用于广告的数据接收模块，用于呈现时隙可用性的配置模块，以及用于广告内容和价值的认证的广告管理模块。提出了一种视频表示方案[29]在无监督学习中捕获视频广告的潜在语义。该方案将海报概率信息对象和标识集成到潜在狄利克雷分配（LDA）中，称为ppLDA（posteriorprobabilityinvolvedinLDA）.采用随机森林、kNN、SVM和AdaBoost四种典型分类器对真实视频广告数据实验结果表明，该方案具有较好的分类性能，能够有效地支持广告分类. DeepLink [30]为视频广告引入了一个基于深度学习的框架。在所提出的方案中，深度卷积神经网络（CNN）用于将情景喜剧明星和在线商店与服装检索联系起来。DeePLink采用了多个深度CNN模型，实现了人体姿态选择、人体检测、人脸验证、服装检测和广告图像检索等多个子模块。将深度CNN模型转移到数据域，然后基于构建的大规模服装数据集训练相应的模型，从而有效地将服装检索应用于视频广告系统。由于RTB是一种提供在线广告的首选方式-对于广告交换和搜索提供商，Andrey et al.[20]提出了RTB的自适应目标，J.A. Choi和K.Lim/ICT Express 6（2020）175179表1目标广告的机器学习方法用于目标广告的机器学习方法用户为中心的方法内容中心法行为定位[二]《中国日报》上下文广告[12、27]关键字浏览[6]美国显示[28日]点击率赞助商搜索[7[2、7]视频车辆[29、30][18个国家]用户简档分析点击欺诈[10、11、26][22博客Web文档实时竞价[17个][12个][20、21]的CTR。评估结果表明，与建议的自适应策略的广告活动显着提高CTR。引入了基于模型的强化学习模型[21]来学习RTB显示广告中的投标策略。在该方案中，投标决策过程被制定为一个强化学习问题。通过模拟拍卖竞争的状态转移，建立了实时竞价广告效果优化3.3. 广告中的点击欺诈检测点击欺诈在广告中是一个具有挑战性的问题，它可能会对广告预算产生负面影响，并损害在线广告市场的完整性。为了检测点击欺诈，提出了一种基于集成学习的方法[23]用于移动广告中的点击欺诈检测。一组新功能用于检测现有属性中的点击欺诈。为了评估，最终的集成模型的基础上，六种不同的学习算法进行了分析，在三个不同的性能指标，表明该模型可以检测到欺诈的合作伙伴与高利率。在最近的工作中，Taneja等人。[22]提出了一个移动广告框架，根据与手机上的网络冲浪信息相关的点击数据来检测欺诈合作伙伴。该框架包括递归特征筛选（ RFE ）作为特征选择技术和 Hellinger 距离决策树（HDDT）作为分类器，以识别欺骗性发布者。Paulo等人[25]还提出了一种检测和防止点击欺诈行为，并在一个有三个主要代理的广告网络上实施。所提出的系统的主要思想该系统在测试环境中对不同类型的攻击表现出良好的性能，并建议在现实世界的场景中通过优化来4. 讨论和结论本文研究了各种机器学习技术在在线广告策略中的应用，以优化在线目标广告。目标广告策略以及相应的机器学习技术总结在表1中。对人工智能和数据驱动方法集成到数字广告的兴趣和需求日益增加，导致需要进行当前的研究。有针对性的在线广告策略和相应的基于机器学习的技术被识别并分为两大类，以用户为中心和以内容为中心的方法。本文还确定了基于机器学习的点击欺诈检测系统的需求，以保护广告商免受非法点击。这种分类是未来研究机器学习和人工智能技术的基础，以进一步优化在线广告策略的目标和有效性，并解决广告中的安全和隐私问题，例如点击欺诈检测。致谢这项工作得到了A.R.T.的部分支持。计划和艺术学院和传播中心的创意活动研究夏季补助金，新泽西州威廉帕特森大学。竞合利益作者声明，他们没有已知的可能影响本文所报告工作引用[1] J.A.崔河，巴西-地文化与明星力量战略：比较美国和韩国对名人代言广告的反应。球。Mark. 30（1）（2017）3[2] Y. Chen，M. Kapralov，J. Canny，D.Y.巴甫洛夫，广告定位的因素建模，在：神经信息处理系统的进展，2009年，pp。324-332.[3] A. Capatina ， M. Kachour ， J. Lichy ， A. Micu ， A. Micu ， F.Codignola，将基于人工智能的社交媒体营销软件的未来功能与潜在用户的期望相匹配，Technol。预报. Soc. 改字（2020）119794号。[4] S.L. Lo，D.康福斯河Chiong，训练数据集对极端学习机和支持向量机的影响，用于Twitter上的目标受众识别，在：ELM-2014会议记录第1卷，Springer，Cham，2015年，pp. 417-434[5] S.L. 洛河，巴西- 地 Chiong ， D. Cornforth ，Using support vectormachineensembles for target audience classification on Twitter，PLoSOne 10（4）（2015）.[6] H. Li，D. Zhang，J. Hu，H. Zeng，Z.，中国植物志.陈，从在线广播内容中寻找关键字用于定向广告，在：会议记录2007年，第一届广告数据挖掘和受众智能国际研讨会，pp.55比62[7] A. Ta，因式分解机与跟随正规化领导者的CTR预测显示广告，在：2015年IEEE大数据国际会议论文集（大数据），IEEE，2015年，pp. 2889 -2891。[8] Y. Tagami，S. Ono，K.山本K. Tsukamoto，A. Tajima，上下文广告的Ctr预测：学习排名方法，第七届数据挖掘国际研讨会论文集在线广告，2013年，pp。一比八[9] Q. Wang ， F. Liu ， S. Xing 、 X. Zhao ， A new approach foradvertisingCTRpredictionbasedondeepneuralnetworkviaattentionmechanism，Comput. 数学方法Med.（2018年）。180J.A. Choi和K.Lim/ICT Express 6（2020）175[10] A.阿迪斯湾Armano，E. Vargiu，Profiling users to perform contextualadvertising，in：Proceedings of the 10th Workshop dagli Oggetti agliAdvertising（WOA 2009），2009.[11] M. 比连科湾 Richardson ， Predictive client-side profiles forpersonalized advertising，in：Proceedings of the 17th ACM SIGKDDInternational Conference on Knowledge Discovery and Data Mining，2011.[12] Y.张，A.C. Surendran，J.C. Platt，M. Narasimhan，Learning frommulti-topicwebdocumentsforcontextualadvertising ， in ：Proceedings of the 14th ACM SIGKDD International Conference onKnowledge Discovery and Data Mining，2008，pp.1051-1059[13] 50统计显示个性化的力量，2020年，https：//www. 为了你。C/C/[14] Z. Jiang，S.高，W.戴，基于深度架构模型的上下文广告点击率预测研究，控制工程应用。告知。18（1）（2016）11-19.[15] O. Chapelle，E.马纳夫奥卢河罗萨莱斯，简单和可扩展的反应预测显示广告，ACM trans.intell。系统技术（TIST）5（4）（2014）1-34。[16] H.Zhang ， X. 曹， J.K.L.T.W.S.Chow ， Object-levelvideoadvertising：an optimization framework，IEEE Trans. Ind. Inf.13（2）（2016）520-531.[17] T.范角，澳-地Chang，以博客为中心的上下文广告，专家系统。38（3）（2011）1777-1788。[18] Q. Huang，黄氏拟谷盗D.作者：Greene，J.卡拉布里亚，汽车网络广告系统，2007年，美国。专利申请11/213，129.[19] K. Lim，D. Manivannan，一个有效的协议，用于认证和安全的消息传递在车辆ad hoc网络，车辆。Commun. 4（2016）30-37.[20] A. Pepelyshev，Y. Staroselskiy，A. Zhigljavsky，Adaptive targetingforonline advertising ， in ： Proceedings of International WorkshoponMachine Learning ， Optimization and Big Data ， Springer ，Cham，2015，pp. 240-251。[21] H.蔡氏K.任，W。Zhang，K. Malialis，J. Wang，Y. Yu，D.郭，实时竞价通过强化学习在显示广告中，在：第十届ACM网络搜索和数据挖掘国际会议论文集，2017年，pp.661-670。[22] M. Taneja，K.加格A。Purwar，S. Sharma，Prediction of clickfraudsin mobile advertising ，in ： Proceedings of 2015 EighthInternationalConference on Contemporary Computing（IC3），IEEE，2015，pp.162比166[23] K.S.佩雷拉湾Neupane，M.A. Faisal，Z. Aung，W.L. Woon，Anovelensemble learning based approach for click fraud detection inmobileadvertising ， in ： MiningIntelligenceandKnowledgeExploration，Springer，Cham，2013，pp. 370-382.[24] C.M.R. Haider，A. Iqbal，A.H. Rahman，M.S. Rahman，基于集成学习的移动广告中印象欺诈检测方法，J。网络Comput. Appl. 112（2018）126[25] P.S. Almeida，J.J. Gondim，广告网络点击欺诈检测和预防系统，J.Inf. Secur. Cryptogr. 5（1）（2018）27-39。[26] R.B. Tareaf ， P. Berger ， P. Hennig ， J. Jung ， C. Meinel ，识别audience属性：预测年龄，性别和个性以增强文章写作，在：2017年国际会议论文集云计算和大数据计算，2017年，pp。79比88[27] D. 查克拉巴蒂D. Agarwal，V. Josifovski，Contextual advertisingby combining relevance with click feedback，in：Proceedings of the17th international conference on World Wide Web，2008，pp. 417-426[28] C.佩利希湾Dalessandro，T. Raeder，O. Stitelman，F.针对有针对性的显示广告的机器学习：行动中的转移学习，Mach。学习. 95（1）（2014）103[29] S. Hou，S. Zhou，W. Liu，Y.郑，通过主题化高级语义概念对广告视频进行分类，多媒体工具应用77（19）（2018）25475-25511。[30] H. Zhang， Y.吉，W.黄湖，澳-地Liu，基于情景喜剧明星的视频广告服装检索：深度学习框架，神经计算。申请31（11）（2019）7361-7380。

下载后可阅读完整内容，剩余1页未读，立即下载