没有合适的资源?快使用搜索试试~ 我知道了~
搜索引擎个性化政治查询结果的影响
主题:Web与社会WWW 2018,2018年4月23日至27日,法国里昂955审查政治相关搜索引擎结果页面的个性化和组成罗纳德·E 罗伯逊东北大学rer@ccs.neu.eduDavid Lazer东北大学d. neu.edu克里斯托威尔逊东北大学cbw@ccs.neu.edu摘要搜索引擎是人们在当今互联世界中获取信息的主要手段。然而,除了搜索引擎公司本身,很少有人知道他们的算法是如何过滤,排名和呈现给用户的网络。这个问题与政治查询特别相关,因为人们越来越担心过滤泡沫,最近发现搜索排名中的偏见或偏袒会影响投票行为。在这项研究中,我们进行了有针对性的算法审计谷歌搜索使用一组动态的政治查询。我们设计了一个Chrome扩展来调查参与者,并收集搜索引擎结果页面(SERP)和自动完成建议,这些建议是他们在唐纳德特朗普总统就职典礼后的一个月内搜索我们的政治查询集时会使用这些数据,我们发现显着差异的组成和个性化的政治相关的SERP查询类型,主题CCS概念• 信息系统→页面和网站排名;内容排名;个性化;·社会和专业主题→政治演讲;·以人为中心的计算→用户界面设计;关键词搜索引擎结果;搜索排名偏差;自动完成搜索建议;政治人格化;过滤气泡ACM参考格式:罗纳德·E Robertson,David Lazer,and Christo Wilson. 2018.审查政治相关搜索引擎结果页面的个性化和组成。在WWW 2018:2018年网络会议,2018年4月23日至27日,里昂,法国。ACM,New York,NY,USA,11页。https://doi.org/10.1145/3178876.31861431介绍最近围绕政治两极分化、假新闻和媒体对公众舆论影响的担忧主要集中在Facebook和Twitter等社交媒体平台然而,最近的调查表明,通过搜索引擎搜索的新闻比通过社交媒体搜索的新闻更多[2,57],并且搜索引擎是第二个最有可能激发后续行动的新闻门户,例如本文在知识共享署名4.0国际(CC BY 4.0)许可下发布作者保留在其个人和公司网站上以适当的归属方式传播作品的权利。WWW 2018,2018年4月23日©2018 IW3C2(国际万维网会议委员会),在知识共享CC BY 4.0许可下发布。ACM ISBN 978-1-4503-5639-8/18/04。https://doi.org/10.1145/3178876.3186143进一步搜索、在线分享或与他人谈论新闻[50]。据报道,搜索引擎也是最值得信赖的新闻来源[7],大多数搜索引擎用户认为搜索引擎排名是公正,准确和公平的[66]。这种根深蒂固的信任的一个行为推论是搜索引擎用户的持久的、可预测的自上而下的浏览模式[60]。 对搜索引擎点击率(CTR)的长期研究一致表明,前三个搜索结果获得了超过50%的点击,75%的点击是在第一个搜索引擎结果页面(SERP)上进行的[67]。 类似的浏览模式似乎发生在几乎任何在线平台上,其中内容排名[4,19,23,31,40]。这些启发式驱动的行为模式,被称为顺序效应,是心理和行为科学中发现的最强大的效应之一,并赋予实体对内容进行排名,以改变态度,信念和行为[3,20,21,34,55]。学者和监管机构对搜索引擎可能对用户产生的潜在负面影响表示担忧,特别是在政治信息方面。一个相关的问题是,在政治相关的搜索排名偏袒可以改变投票决定[21,22]。另一个问题是,个性化排名将用户限制在“过滤气泡”中这些关注点共同围绕着信息的过滤、定位和显示,以及这些因素在用户之间可能会如何系统地变化。过滤、排序和塑造信息的算法无疑在我们有效浏览互联网的能力中起着至关重要的作用,但鉴于其输出的重要性和上述问题,开发用于保存和量化其信息呈现的方法至关重要[32,36]。在本文中,我们专注于在Google搜索上进行的与政治相关的搜索,并报告了受控算法审计的结果[68]。在特朗普我们在扩展中植入了一组21个根查询,并将其设计为获得每个根查询的Google自动完成建议。对于所有105个结果查询(即,每个根及其四个子项),扩展同时检索一对GoogleSERP,一个来自标准,一个来自匿名浏览器窗口。这些成对的结果集使我们能够隔离用户的cookie(在匿名窗口中不使用)对Google排名算法的主题:Web与社会WWW 2018,2018年4月23日至27日,法国里昂956在解析了我们通过扩展收集的自动完成搜索建议和SERP后,我们发现根查询的建议多样性存在差异,并确定了一组不同的SERP组件,这些组件影响了信息的过滤,定位和显示。我们还发现,个性化,定义为从标准和匿名配对的SERP收集的两组URL之间的排名加权差异,作为根查询,政治偏好,Alphabet服务使用和日期的函数而变化。总的来说,我们的工作做出了以下贡献:我们提供了桌面Google搜索的第一次审计,该审计考虑了界面的整个排名列部分的排名和组成,并引入了一个用于量化信息排名(个性化)和显示(组成)模式的框架 , 该框 架 可 以 在 具有 排 名 列 表 的其 他 平 台 ( 如Facebook,Red-dit和Twitter)中推广。我们证实,登录到Google帐户的个人获得了更大的个性化,提供了事件发生后个人化总体幅度的时间差异证据,并将搜索查询及其自动完成建议组合成一个新的根和子结构,表明这些结构在根的多样性方面有所不同。我们的审计揭示了查询和排名的个性化和组合的实质性差异,首次揭示了以前未识别的组件(例如,嵌入式Twit- ter结果),并揭示了两个组件类型在顶级搜索排名(知识和新闻卡)的突出性,为未来研究其特色内容及其对用户的影响铺平了道路。纲要本研究的其余部分安排如下。我们首先回顾了之前对Google搜索进行的几次算法审计(第2节),然后介绍了我们自己的审计方法(第3节)。然后,我们提供了我们收集的调查,搜索和建议数据的概述(第4节),探索SERP组成的差异(第5节),并测量Google搜索上的个性化差异(第6节)。最后,我们讨论了我们的结果(§ 7)和局限性(§ 8)。2背景被称为算法审计的研究技术提供了一个有用的框架,用于调查算法的输出并审计其潜在的偏差[49,68]。审计技术的逻辑源于旨在识别歧视性招聘做法的社会科学研究[49],研究人员系统地改变了输入(例如,申请人的种族)并检查其对输出的影响(例如,接收呼叫的可能性)。利用这种范式,研究人员对在线市场中的算法进行了审计[12,13,33,47,48],Twitter上的搜索排名偏见[38],Facebook的NewsFeed al-m的用户意识[ 24],在线地图的本地化[69],以及这里最相关的搜索引擎排名[32,36,43,45]。Google搜索审核。据我们所知,第一次Google搜索审计是在2013年进行的,使用了一项调查和基于代理的数据收集来衡量搜索个性化[32]。总体而言,Hannak et al. 发现(1)高于噪声基底的一般个性化的证据,(2)高排名结果的更大稳定性,以及(3)缺乏基于用户过去的浏览和搜索行为的个性化。他们还报告说,当他们的制造用户帐户登录和使用政治查询时,他们的个性化程度更高,并且一些个性化基于IP地址地理位置[32]。Silver等人在Google搜索的移动版本中对基于地理位置的个性化进行了类似的研究[36]。然而,与以前的工作不同,Silver等人是第一个通过专门检查一般,新闻三元组和地图结果来参与Google SERP中结果的复杂呈现的人。Silver等人的一般结果是大多数搜索引擎共享的标准蓝色链接(可能带有一些附带的解释性文本),而新闻三元组的特点是一个带有图像的新闻文章的主链接和两个较小的新闻文章链接。地图结果将Google地图嵌入到页面中。在这项工作中,我们把这些离散类型的结果作为组件。最近,研究人员探索本地化版本的谷歌发现,一个地理区域发展出版和科学产业的程度与返回的搜索结果的本地性密切相关[5]。最近的另一项审计是在2016年美国国会选举期间对Google,Yahoo和Bing的搜索引擎进行的[45]。使用政治家然而,这些发现是有限的,因为这些检索似乎是在没有控件或真实用户的情况下进行的,并且没有对组件类型进行区分。一种类型的组件,其存在和影响尚未得到充分探讨,是出现在Google SERP顶部的知识不幸的是,最近对这些知识组件的审计显示,它们的存在减少了网站的流量,否则将占据第一排名,最明显的是维基百科[43]。知识组件的存在也使用户更有可能将他们发现的信息归功于谷歌而不是维基百科。除了对流量损失的担忧之外,还存在几个记录在案的知识组件突出有争议或不真实信息的案例例子包括美国总统谁是三K党的积极成员名单和答案是否奥巴马正在策划政变[35,52,71]。虽然信息量很大,但这些审计的结果是有限的,因为它们依赖于基于代理的或其他间接的数据收集方法,缺乏对隔离个人化的控制,或者关注现代Google SERP中出现的组件的子集 [5,32,36,43,45]。此外,先前已经被采用来量化排名相似性的度量(如Jaccard指数或编辑距离)在它们区分朝向排名列表的顶部发生的排名差异和朝向底部发生的差异的能力方面是有限的一···主题:Web与社会WWW 2018,2018年4月23日至27日,法国里昂957图1:Google搜索组件的示例。从上到下的知识,人问,新闻卡,推特,人搜索和相关搜索组件。所有组件都出现在SERP中的自己的行中,但我们在这里压缩了它们。排名相似性的更准确的测量应该包括搜索引擎用户的可预测的浏览模式,以使高排名项目的变化比低排名项目的变化更重要[51,74]。Google搜索建议。策划搜索建议的算法可能会通过利用启发式方法来控制用户消费的内容,例如建议排名中的顺序效应,建议术语效价中的负面偏见,以及HTML效果,如粗体以引起注意。大部分他们的搜索预测是基于各种因素,包括您键入的术语,这些术语的流行度和新鲜度,您的搜索和浏览历史以及您所在地区的热门话题[29]。3方法我们通过考虑不仅仅是URL的排名[32,36,45]或某些组件的内容[43]来接近我们对Google搜索的审计,但是平台产生的SERP的整体组成,它提供的URL,以及塑造每个1的因素。我们在2017年1月19日唐纳德·特朗普就职典礼后的五周内进行了实验在就职典礼上,第二天,以及接下来的一周 , 我 们 在 CrowdFlower 上 发 布 了 招 聘 广 告 ( http ://crowdflower 。 com ) 和 ProlificAcademic ( http :prolific.ac),与广泛使用的Amazon Mechanical Turk(AMT;http://mturk.com)[6,9,65]相当的在线主题池。最近的研究表明,从这些平台招募的参与者比在AMT上招募的参与者更天真,更不诚实[64]。在这两个网站上,我们利用内置功能将我们的招聘广告的可见性限制在美国境内的参与者。在参与者提供知情同意后,我们要求他们完成一项测量其特征的调查在完成调查后,我们要求他们安装我们构建的Chrome浏览器扩展程序,并给他们一个唯一的令牌。令牌允许他们启动扩展,并使我们能够将他们的搜索结果与他们的调查响应配对。下面我们将详细介绍我们的调查、浏览器扩展和隔离个性化的控件。调查. 我们的调查包括人口统计、互联网使用和政治倾向等问题。具体来说,我们询问了Alphabet2服务的使用情况,政治倾向和党派关系,以及新当选的美国总统唐纳德特朗普的评级。我们问参与者“你对唐纳德·特朗普的总体看法是积极的还是消极的?“在11点Likert量表(范围从-5到+5)以及二元评级(负或正)上。两个天平都平衡了。浏览器扩展。我们构建了一个自定义的Chrome扩展程序使我们能够自动检索和保存SERP从参与者在参与者安装了扩展并将调查中的令牌交给它之后,扩展打开了两个新的浏览器窗口,一个是标准的,一个是匿名的,并开始从预定义的查询列表中并行地在两个窗口中进行搜索。这份名单包含了21个可能有关联的人名、地名、国家或团体唐纳德·特朗普的就职典礼(表1)。对于每个查询,每个浏览器窗口都打开一个新选项卡,执行搜索,拍摄DOM的快照,然后关闭选项卡。当扩展队列中的每个查询被执行时,扩展还检索该查询的Google搜索建议,并将它们附加到搜索队列的末尾。对每个根重复该过程,生成总共105个查询和关于Google自动补全建议的现有文献来自非正式出版物,旨在操纵给定查询的建议[70,75],并在一组有针对性的查询的建议中识别审查和诽谤[16,17]。Google表示1本研究已获得IRB批准(Northeastern IRB#16 -11-23),总结数据和代码可在http://personalization.ccs.neu.edu/上获得2Chrome、Gmail、谷歌搜索、YouTube和其他服务的母公司主题:Web与社会WWW 2018,2018年4月23日至27日,法国里昂958·表1:我们使用的根搜索查询类别根查询美国总统2017年美国总统,美国总统特朗普就职典礼,就职典礼,总统就职典礼政党民主党,共和党,独立政治意识形态自由派、温和派、保守派政治演员唐纳德·特朗普,唐纳德·特朗普,迈克·彭斯,迈克·彭斯中国、俄罗斯、普京、联合国完成所有搜索的每个受试者的标准匿名SERP对。这种方法使我们能够(1)利用个人的浏览器-与他们当前的cookie,登录,和搜索历史完好无损-作为代理,通过该代理来收集真实世界的个性化搜索数据,(2)减少由于Google的搜索索引中的时间变化而引起的潜在噪声 虽然以前的审计确定了结转效应,但以前的查询(例如,“HillaryClinton”)可以影响针对新查询返回的SERP(例如,“Email”)[因此,如果这些影响发生在我们的数据中,它们不应该影响我们隔离个性化的能力。4数据概述在这里,我们提供了我们收集的数据的概述。我们首先描述我们的参与者,然后描述他们的SERP的组成。调查数据。总的来说,我们招募了来自Prolific(74%)和Crowdflower(26%)的187名参与者的人口统计学样本。我们的 样 本 是 46% 的 女 性 , 主 要 是 白 人 ( 66% ) 和 亚 洲 人(17%),44%拥有学士学位或更高学位参与者报告的家庭收入中位数为50,000美元至74,999美元,平均年龄为32岁(σ= 12)。(3)第三章。在政治上,我们的样本倾向于自由主义(50%)和民主党(47%)。唐纳德·特朗普在两极量表上的平均评分为-2.4,22%的参与者在二元量表上给了他“积极”的评分。相比之下,特朗普总统在我们进行研究期间的平均支持率为42.3%[25]。我们询问受试者是否是各种Alphabet产品的常规用户,90%或更多的参与者报告经常使用Gmail或YouTubeAlphabet产品的平均数量受试者报告经常使用的产品为4种,累积起来,96%的受试者经常使用两种或两种以上的产品。受试者报告平均每天进行14.2次搜索(σ = 16. 9),谷歌是迄今为止首选的搜索引擎(88%),这一结果与其他搜索引擎使用和偏好调查一致[15,22]。82%的样本报告说Chrome是他们的首选浏览器,最接近的竞争对手Firefox占12%。Google搜索是默认搜索3我们将定期使用定义为每周一次或更多次,并询问了Android、Gmail、Google日历、Google Docs、Google Drive、Google+、Google Groups、Google Maps和YouTube的使用情况谷歌在两款浏览器中都使用了Google Chrome引擎,不过由于Chrome浏览器与谷歌服务的紧密集成,谷歌可能会从Chrome用户那里收集更多信息搜索和建议数据。总的来说,我们收集了15,337个查询的自动完成搜索建议和标准匿名SERP对。在这些查询中,3,624个来自我们的固定根列表,11,713个来自Google。平均查询长度为2.2个单词,这与之前的发现[14,37]相当,因为我们的21个根查询中有14个是一个单词长(表1)。有趣的是,在我们的根查询中,建议的可变性存在很大差异我们通过相对于可能的最小数量(4)和我们观察到的最大数量(“中国”为69)归一化每个根产生的独特建议的数量来量化这种因此,得分为0(仅由利用从参与者获得的SERP对,我们识别了14种独特的结果类型,并提取了456,923个组件和子组件(例如,新闻卡片中的水平卡片)。在我们已识别但尚未提及的组件中,有:twitter组件,由链接到Twitter帐户的标题组成,然后是三个或更多包含来自该帐户的tweet的水平子组件;视频组件,以嵌入的Youtube视频为特色;以及一般组件的轻微变化,以Youtube视频的缩略图(general-video)或指向主URL的子域的链接(general-extra)为特色。Google图像搜索结果的拼贴出现在图像组件中,而Google地图的结果则出现在地图组件[36]和地图卡组件(类似于新闻卡组件,但功能位置而不是新闻)中。最后,people-search和related-search组件都有一组建议的查询,尽管它们的格式不同(图1)。平均而言,标准窗口和隐身窗口在每个SERP中都返回了几乎相同数量的组件和子组件(均为µ= 14)。9,σ= 3。(五)。我们发现配对的SERP之间的组件数量存在微小差异,其中15.3%的对5%的配对存在至少一个组分的差异,并且6.5%的配对存在四个或更多个组分的差异,但是配对SERP之间的Wilcoxon符号秩检验不显著(V = 1. 3310 6,P = 0. 07)。我们发现最小的SERP有7个组件或子组件,最大的有25个。虽然不是本文的重点,但我们注意到Google条(如[43]中所确定的)出现在我们收集的大约69%的 使用McNemar配对样本χ 2检验,我们发现了少量但显著数量的SERP对(1.3%),其中侧条出现在标准匿名配对SERP中的一个而不是两个中(χ 2 = 78. 000,p<0. 01)。侧栏的存在根据根查询而变化很大,其中“Trumpinauguration”和“Donald”分别产生包含侧栏的SERP的最低和最高百分比(图2,左起第二列)。然而,当按根查询分组时,配对差异均不显著,这表明存在或不存在显著性差异。主题:Web与社会WWW 2018,2018年4月23日至27日,法国里昂959建议方唐纳德·特朗普唐纳德·特朗普迈克·彭斯MikePence民主党独立共和党自由派温和派保守派美国总统2017年美国总统特朗普就职典礼总统就职典礼中国联合国俄罗斯普京变异性酒吧按根查询的组件类型按搜索排名列出的12345678910111213141516171819201.00.80.60.40.20.0组件类型图2:按根查询的标准SERP的组成。沿x轴的组件按其普遍性(它们出现在根查询中的数量)排序。填充有灰色交叉图案的单元格表示该根查询从未出现过组件。组件类型图3:按等级的标准SERP的组成。沿着X轴的组分通过它们的中值等级排序填充有灰色十字形图案的单元格指示组件从未出现在该等级。没有侧边条并不是非常个性化的。聚焦于侧栏内的内容的研究可以揭示个性化的附加方面(例如,[43])。5SERP组合物在本节中,我们提供了对形成我们收集的SERP组成 现在,我们专注于标准SERP的子集,并将标准和匿名SERP的比较分析留给§ 6。总体而言,我们发现,接收不同的组件类型的概率不同的根查询,产生它,组件不同的典型排名位置。按根的组件。 使用标准SERP的子集, 我们计算了跨根查询的每个组件类型的概率分布。我们发现根查询的SERP组成存在实质性差异,对于源于根“Donald Trump”的查询,Twitter组件在SERP中出现最频繁,对于源于政党和意识形态名称根的查询,知识组件出现最频繁,对于源于“Donald Trump”和“MikePence”的查询,人员搜索组件出现最频繁(图2)。按等级的组件。为了评估组分如何随等级变化,我们利用位置概率矩阵来确定在给定每个等级的情况下找到每个组分类型的概率(图3)。使用这个矩阵,我们发现,知识和新闻卡是排名最高的组件,占60%以上的所有组件出现在第一级(组成35%和29.8%,分别)。大多数其他排名位置都由一般结果主导,人员搜索和相关搜索组件几乎完全占据了SERP页脚。给定不成比例的点击量和注意力转到第一个结果[60],我们关于第一个排名中知识和新闻卡组件的突出性的发现表明,报告的不真实或有争议的信息可能对检查这些主题的搜索者有很高的曝光率[35,52,71]。域.2016年一份关于网站流量来源的报告发现,谷歌占发布商网站所有推荐的39.5%考虑到高流量推荐率和关于维基百科的先前发现[43],我们从每个SERP中提取了4个存在于Google的直接回答(知识和人问),一般和媒体组件(新闻卡,新闻三元组和Twitter)的标题中的URL,并将它们按各自的二级域名(例如, cnn.com)上提供。在所有组件类型中,我们发现,前20%的域(n= 724)占96.1%的所有域,我们发现。结构域存在的这种不平等也存在于各个组分中(表2)。虽然新闻卡片和新闻三元组组件都有类似的功能显示新闻文章但它们呈现的顶级领域有很大的不同,这表明它们的底层算法存在差异。这一发现得到了我们的观察的支持,即新闻卡片和新闻三元组响应于类似的根查询而显示(图2),这意味着顶级域中的差异不是由不同的查询引起的。4我们提取了大多数结果标题中的URL(例如, 一般、新闻卡、新闻三元组和知识组件)。对于twitter组件,我们从组件头中提取帐户URL,以及在每个子组件(tweets)中找到的第一个URL对于people-ask组件,我们只提取第一个URL。根查询秩主题:Web与社会WWW 2018,2018年4月23日至27日,法国里昂960--表2:六种组分和子组分类型的前十个最频繁出现的域知识(n=9, 029)%people-ask(n=7, 050)%一般(n=307, 275)%新闻卡(n=49, 188)%news-triplet(n=3,637)%推特卡(n=32, 429)%没有URL65.5没有URL80.8en.wikipedia.org8.7nytimes.com6.5nytimes.com10.5twitter.com79.8en.wikipedia.org12.2en.wikipedia.org5.5nytimes.com4.2cnn.com6.4cnn.com5.8ind.pn4.0books.google.com5.2enkivillage.com1.2twitter.com3.0foxnews.com3.7npr.org4.6buff.ly1.6dictionary.com2.4infoplease.com1.0cnn.com2.6washingtonpost.com2.8telegraph.co.uk4.3bit.ly1.5depressionet.org.au2.3timeanddate.com0.9theatlantic.com2.6nbcnews.com2.8abcnews.go.com4.1conservativereview.com1.5grammar-monster.com2.0al.com0.8facebook.com2.2usatoday.com2.6usatoday.com3.6en.kremlin.ru1.1careers.un.org1.6nationalistpartyamerica.com0.8washingtonpost.com1.8bbc.com2.4foxnews.com3.2conservativetribune.com1.1historyinpieces.com0.9globalpolicy.org0.7time.com1.4telegraph.co.uk2.3cbsnews.com3.1miamiherald.com1.1owl.english.purdue.edu0.8indy100.independent.co.uk0.6usatoday.com1.4politico.com1.9bbc.com2.945.wh.gov1.0factmonster.com0.8aims.edu0.6merriam-webster.com1.2npr.org1.9reuters.com2.2instagram.com0.90.20.01 2 34建议排名0.20.00.2Google+ Google日历安卓谷歌地图图4:所有建议等级的个性化平均值误差条表示95% CI。6个性化为了衡量个性化,我们使用从每个SERP中提取的URL列表,然后利用称为Rank-Biased Overlap(RBO)[74]的排名相似性度量来比较找到在每个标准隐姓埋名的SERP对上。我们使用RBO,因为它提供了一个不确定的排名相似性措施,特别适合于比较搜索0.00.20.00.20.0YouTubeGmailGoogle DocsGoogle Drive引擎排名它说明了其他常用的秩相似性表示的秩比较的几个重要方面非常规用户常规用户非常规用户常规用户包括Kendall的τ和Spearman的ρ在内的所有结果都具体来说,RBO解释了(1)最高权重,通过对排名顶部的差异施加更强的惩罚,(2)不完整性,通过处理包含不同项目的列表,而不假设潜在的连接性,以及(3)不确定性,通过限制概念上无限尾部中看不见的项目的权重。RBO采用确定度量的最高权重的参数p。如果p= 0。9,则前10个等级占评价的86%[74]。为了设置p,我们首先获得了2017年1月的CTR数据,发现前13个排名(我们数据集中组件的平均数量)占点击量的80.4%[67]。我们用它来找到p = 0。938,将80.4%的RBO评价权重归因于前13个等级5。鉴于RBO是排名相似性的度量,我们使用它来定义一对SERP的个性化为:1−RBO(U RLsinco дnitoo,U RLstanddard).(一)因此,个性化的范围可以在0和1之间,其中0表示给定的标准SERP和匿名SERP是相同的6。5参见原始Webber et al. 论文[74]中关于RBO以及如何设置p的更多细节。6我们发现,RBO与先前工作中可操作的个性化指标(包括jaccard指数(ρ =0))具有相当强的相关性。739,p<0. 001),0到1的有界相似性度量(两个集合的并集上的交集),以及未登录已登录图5:通过参与者的Google帐户登录状态(彩色条)和他们对单个Alphabet服务的常规使用(X轴)的具有95%CI的平均个性化只有四名参与者报告经常使用Google Groups,并且在审计期间都登录了,所以我们从图中省略了它。对于右列中最下面的三个服务,普通用户无论其登录状态如何都会收到相同级别的个性化。通过搜索建议进行个性化。考虑到autocomplete是个性化的[29],我们检查了个性化是否因产生配对SERP的搜索建议的排名顺序而异(图4)。 使用非参数Kruskal-Wallis χ2检验,我们发现通过建议等级的个性化的显著差异,在第二等级产生的SERP比在第一等级产生的SERP高26.7%。然而,组成查询的单词的数量与个性化没有显著相关,并且字符的数量与个性化仅弱相关(ρ= 0. 05,p<0. 001)的情况下。这可能编辑距离(ρ= 0. 656,p<0. 001),排名差异的整数度量(交换、插入和删除的数量)。未登录登录个性化个性化主题:Web与社会WWW 2018,2018年4月23日至27日,法国里昂961·····--0.30.20.10.0政党二进制特朗普评级负正唐纳德·特朗普唐纳德民主党其他共和党特朗普评级正负Google帐户登录未登录未登录已登录Google帐户未登录已登录Google帐户特朗普·迈克·彭斯0.30.20.10.0-5-4-3-2-1 0 1 2 3 4 5双相特朗普评级(所有受试者)MikePence民主党独立共和党自由派图6:参与者对唐纳德·特朗普及其政党的评分的平均个性化和95% CI温和保守的美国总统虽然这表明第二搜索建议对于自动完成算法的一些重要性,但是关于人们如何浏览和选择搜索建议的数据在很大程度上是不可用的。通过Google Usage进行个性化。我们发现,谷歌搜索的个性化程度随着参与者报告的经常使用的Alphabet服务的数量而增加(ρ = 0)。07,p <0. 001),登录Google帐户的参与者比未登录的参与者高出19.3%(U= 1。52 10 7,p<0. 001)的情况下。在我们要求参与者判断他们是否经常使用的Alphabet服务中,我们发现经常使用2017年美国总统特朗普就职典礼总统就职典礼中国联合国俄罗斯普京0.00.20.0 0.2 0.0个性化无论参与者的Google帐户登录状态如何,服务子集的个性化程度都有所提高(图5)。虽然非常规用户谁登录到他们的谷歌帐户收到显着更大的个性化服务比那些谁没有(所有P<0. 001除了Youtube的普通用户均
下载后可阅读完整内容,剩余1页未读,立即下载
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pptx](https://img-home.csdnimg.cn/images/20210720083543.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://profile-avatar.csdnimg.cn/default.jpg!1)
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![](https://csdnimg.cn/release/wenkucmsfe/public/img/voice.245cc511.png)
会员权益专享
最新资源
- VMP技术解析:Handle块优化与壳模板初始化
- C++ Primer 第四版更新:现代编程风格与标准库
- 计算机系统基础实验:缓冲区溢出攻击(Lab3)
- 中国结算网上业务平台:证券登记操作详解与常见问题
- FPGA驱动的五子棋博弈系统:加速与创新娱乐体验
- 多旋翼飞行器定点位置控制器设计实验
- 基于流量预测与潮汐效应的动态载频优化策略
- SQL练习:查询分析与高级操作
- 海底数据中心散热优化:从MATLAB到动态模拟
- 移动应用作业:MyDiaryBook - Google Material Design 日记APP
- Linux提权技术详解:从内核漏洞到Sudo配置错误
- 93分钟快速入门 LaTeX:从入门到实践
- 5G测试新挑战与罗德与施瓦茨解决方案
- EAS系统性能优化与故障诊断指南
- Java并发编程:JUC核心概念解析与应用
- 数据结构实验报告:基于不同存储结构的线性表和树实现
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035111.png)
安全验证
文档复制为VIP权益,开通VIP直接复制
![](https://csdnimg.cn/release/wenkucmsfe/public/img/green-success.6a4acb44.png)