没有合适的资源?快使用搜索试试~ 我知道了~
8930我们阅读什么,我们搜索什么:193个国家的媒体关注和公众关注0Haewoon Kwak 卡塔尔计算研究所哈马德∙本∙哈利法大学 多哈,卡塔尔haewoon@acm.org0Jisun An 卡塔尔计算研究所哈马德∙本∙哈利法大学 多哈,卡塔尔jisun.an@acm.org0Joni Salminen 卡塔尔计算研究所哈马德∙本∙哈利法大学 多哈,卡塔尔jsalminen@hbku.edu.qa0Soon-Gyo Jung 卡塔尔计算研究所哈马德∙本∙哈利法大学 多哈,卡塔尔sjung@hbku.edu.qa0Bernard J. Jansen卡塔尔计算研究所哈马德∙本∙哈利法大学 多哈,卡塔尔jjansen@acm.org0摘要0我们调查了2016年3月7日至2017年4月14日期间193个国家的新闻媒体组织的国际关注与这些国家内公众表达的国际利益的一致性。我们收集了来自UnfilteredNews的十四个月的在线新闻数据和来自GoogleTrends的网络搜索量数据,并构建了媒体关注和公众关注的多重网络,以研究其结构和动态特性。在结构上,媒体关注和公众关注在分析的分辨率上既相似又不同。例如,我们发现63.2%的特定国家的媒体和公众关注不同的国家,但通过网络模式测量的局部关注流模式非常相似。我们还展示了媒体和公众关注的强烈地区相似性,只有显着的全球事件(例如英国退欧)才会打破这种相似性。通过Granger因果关系,我们表明有相当数量的国家的媒体关注和公众关注在主题兴趣上不同。我们的研究结果表明,媒体和公众对特定国家的关注往往不一致,这表明这些国家的公众可能忽视了他们国内的新闻媒体,并寻求其他在线来源来满足他们的媒体需求和欲望。0关键词0新闻报道;网络搜索;多重网络0ACM参考格式:Haewoon Kwak,Jisun An,Joni Salminen,Soon-GyoJung和Bernard J.Jansen。2018年。我们阅读什么,我们搜索什么:193个国家的媒体关注和公众关注。在2018年WWW会议上,2018年4月23日至27日,法国里昂。ACM,美国纽约,纽约,10页。https://doi.org/10.1145/3178876.31861370本文以知识共享署名4.0国际(CC BY4.0)许可证发表。作者保留在个人和公司网站上传播作品的权利,并附上适当的归属。WWW 2018,2018年4月23日至27日,法国里昂。©2018IW3C2(国际万维网会议委员会),根据知识共享CC BY 4.0许可证发布。ACM ISBN978-1-4503-5639-8/18/04。https://doi.org/10.1145/3178876.318613701 引言0国内媒体机构对外国新闻报道塑造了公众对外国的看法[49],制定了公众舆论,并为决策者对突出问题做出反应提供了基础[42]。因此,根本问题是哪些国家受到国内媒体机构的报道,哪些国家没有受到报道。虽然已经有一系列研究揭示了有关外国新闻报道的系统因素[21,47,53],但媒体机构并不是孤立的,而是通过监视观看次数,点赞或转发等与观众互动以了解他们的兴趣[6,56]。因此,仅关注媒体的方法可能只揭示了故事的一部分。然而,令人惊讶的是,新闻报道和公众兴趣的时空对齐相对较少被探索。随着新闻行业的竞争加剧,公众更容易获得各种新闻来源,媒体机构需要考虑与公众兴趣的对齐以生存。在这项研究中,我们比较和对比了各个国家的外国新闻报道和公众兴趣。我们称之为媒体关注和公众关注。为了对媒体关注和公众关注进行建模,我们从UnfilteredNews[17]收集了193个国家中每个国家每日前100个热门话题的数据,Unfiltered News是一个使用GoogleNews数据的在线新闻聚合器,并从GoogleTrends[10]收集了一个国家关于另一个国家的网络搜索量数据,时间跨度为2016年3月7日至2017年4月14日的十四个月。我们的研究问题如下:0• RQ1:媒体关注和公众关注如何在结构上对齐? •RQ2:媒体关注和公众关注之间的因果关系是什么? •RQ3:是否有影响媒体关注和公众关注之间互动的主题方面?0通过使用我们的纵向数据收集,我们构建了一个由193个国家的媒体关注层和公众关注层组成的多重网络。对多重网络的拓扑分析和两个层上链接权重的时间序列分析定量地回答了我们的研究问题。0Track: Web and Society WWW 2018, 2018年4月23日-27日,法国里昂89402 相关工作 2.1 新闻报道作为媒体关注0在数字时代之前,新闻媒体是普通人获取国外事件信息的主要途径。自从Galtung和Ruge提出了新闻价值及其与新闻选择的关系的概念[8]以来,随后的研究揭示了各种因素[13],如国家之间的权力关系[54,55],以解释影响国外新闻报道的因素。有时这些因素会在新闻报道中形成偏见。例如,Joye观察到西方新闻媒体对以欧美为中心的世界秩序存在偏见。早期关注少数国家的研究由于文化、地区和政治差异,如西方社会与非西方社会之间的差异,显示出不一致的影响因素[36]。1984年,Sreberny-Mohammadi基于从46个国家收集的数据集进行了一项关于国外新闻报道的重要研究[43]。这些数据已经进一步分析,并帮助确认了国家之间地理和经济接近对国外新闻报道的关键作用[44]。新的公开可用的新闻数据集,如GDELT项目[24]和EventRegistry[40],使研究人员能够全球范围内研究国外新闻报道[3, 4,21]。强烈的地区主义和一些国家之间的权力结构一直是一致的发现[18, 21, 47]。02.2 网络搜索作为公众关注0了解突出问题的传统方法是进行民意调查;自20世纪60年代以来,盖洛普公司的“您认为当前我国面临的最重要问题是什么?”一直是了解美国社会突出问题的事实上的标准问题。虽然这些民意调查被用作公众舆论的纵向研究的主要来源[16],但它们需要时间和资源来扩大规模。随着互联网连接的普及,公众的在线信息搜索行为,如AOL的“今日新闻”讨论[38],雅虎!热门指数[14]和谷歌趋势[28,50],已被研究作为问题突出性的衡量标准。与传统方法相比,可以更不显眼和高效地收集在线信息搜索行为。02.3 媒体关注和公众关注之间的相互作用0有几次尝试理解媒体关注和公众关注之间的相互作用。Towers等人研究了美国埃博拉疫情的互联网搜索和新闻报道之间的关系[45]。通过使用Granger因果关系,他们发现新闻报道是网络搜索的重要驱动因素。Weeks和Southwell调查了互联网搜索和关于巴拉克∙奥巴马秘密信仰穆斯林的新闻报道之间的关系[50],他们发现两者之间的相关性在新闻报道发表当天达到峰值。Mukherjee和Jansen研究了大型体育赛事期间广告的影响。他们报告说广告对网络搜索有直接影响。虽然大多数关于新闻报道和互联网搜索之间关系的研究都是基于一个或几个主题,我们的工作在一个十四个月的时间段内研究了一般的国外新闻报道和网络搜索。03 数据收集 3.1 UnfilteredNews作为媒体关注0Unfiltered News是Jigsaw(前身为GoogleIdeas)的一个网络服务,它索引了GoogleNews数据库中的新闻文章,并允许用户探索其收藏。特别是,主题和国家级用户界面允许用户探索特定国家在特定日期被新闻媒体提及的热门主题列表。主题是Google知识图谱中的实体[11]。主题的类型是标准的schema.org类型,如人物和地点,可以用于区分同音词。我们使用合理的延迟构建了自己的爬虫,以防止服务器性能下降。我们从2016年3月7日到2017年4月14日期间的每天收集每个国家的每日前100个热门主题。对于每个主题,我们使用Google知识图谱API[12]收集其元数据。这些元数据包含了几个对进一步分析有用的字段。这些字段是唯一标识符、名称、类型和描述。特别是,唯一标识符用于匹配Unfiltered News和GoogleTrends之间的实体。我们在第3.2节中详细解释了这一点。最后,我们每天收集与每个国家的每日前100个热门主题中的任何一个一起提及的主题,这些主题被称为共同提及。例如,如果美国的新闻媒体提到朝鲜的核武器,共同提及就是核武器。由于我们在这项工作中的目标是研究国家之间的关注度,我们只关注主题涉及其他国家的情况。因此,我们有1322730条国家间媒体关注的记录和152557个与之相关的唯一共同提及。03.2 Google Trends作为公众关注0为了收集来自Google Trends的数据,我们使用Pytrends[30],它提供了一个Python接口,可以通过GoogleTrends的Web界面访问数据。来自GoogleTrends的数据是给定时间窗口内给定关键词(或多个关键词)每日(或每周)搜索量的时间序列。在这里,搜索量不是以绝对数字的形式提供,而是以0到100之间的标准化值提供。标准化将给定时间窗口内的最高搜索量设置为100。当给定时间窗口的大小较小时,搜索量的时间分辨率为一天,当时间窗口的大小较大时,时间分辨率为一周。我们发现七个月的时间窗口相当长,仍然具有一天的时间分辨率。因此,我们在通过PyTrends发送查询时使用七个月的时间窗口。除了从2016年3月7日到2017年4月14日收集的UnfilteredNews的新闻报道数据外,我们还收集了同一时期的网络搜索量数据。也就是说,对于每个国家,我们通过发送两个单独的请求来收集在这404天内关于其他国家的Google搜索查询数量,每个请求都有一个七个月的时间窗口。我们在两个请求之间重叠了一天。那一天的目的是使404天的连续时间序列具有相同的标准化比例。我们在第3.4节详细解释了如何连接两个时间序列数据。在这个过程中存在一个语言问题。例如,西班牙语中的美国被写作“Los EstadosUnidos”。这意味着0Track: Web and Society WWW 2018, April 23-27, 2018, Lyon, France1013010401020305…8020101010130…252.575251002512.525507512.5126.2537.5……10029939919294…79199910029…Track: Web and SocietyWWW 2018, April 23-27, 2018, Lyon, France8950为了从一个国家获取关于其他国家的正确搜索量,我们需要知道对应国家语言中它们的名称。此外,国家的缩写可能是另一个问题。在每种语言中找到每个国家的所有缩写并不直观。GoogleTrends通过使用Google知识图谱实体标识符来解决这个潜在问题。该标识符是唯一分配给概念的。例如,标识符/m/09c7w0表示美国的国家概念。因此,/m/09c7w0的搜索量包含了Google能够识别的美国语言变体和缩写。我们通过使用Google知识图谱API[12]获取每个国家的Google知识图谱实体标识符,并使用它们查询搜索量。与Unfiltered News中的共同提及类似,GoogleTrends提供了相关主题,即与给定关键词一起搜索的关键词。然而,由于限制速率,收集所有相关主题是不可行的。因此,在这项工作中,我们不涵盖共同搜索关键词,并将其留给将来的工作。03.3 共同提及的主题推断0从未过滤的新闻中收集的共同提及描述了一个国家对另一个国家的媒体关注的上下文。我们使用词嵌入[29]对每个共同提及进行主题推断。我们使用最大的Glove预训练词向量,包含840B个标记和300维向量[35]。通过手动比较几个新闻网站,我们建立了一个包含11个常见主题的集合,例如世界、政治、商业、技术、科学、健康、体育、艺术、风格、食品和旅行。然后,对于每个共同提及,我们计算与每个主题的距离,并将主题分配给最短距离。例如,由于共同提及“签证”与其他10个主题相比,最接近“旅行”,我们将签证视为与旅行相关的共同提及。03.4 时间序列连接0图1总结了从GoogleTrends获取的两个时间序列的连接。例如,该图解释了从某个国家获取韩国(KR)和美国(US)的搜索量的情况。第一个请求的时间窗口为2016年3月7日至2016年10月7日的七个月,第二个请求的时间窗口为2016年10月7日至2017年4月14日。为了连接来自两个请求的相应时间序列,我们应该有一个参考值,即使GoogleTrends在给定的时间窗口内对搜索量进行了归一化,该参考值也不会改变。为此,我们使用2016年10月7日美国的搜索量(以蓝色框标记)作为参考。为了处理可能为零的情况,我们将搜索量加1。由于第一个请求中2016年10月7日美国的搜索量通过将原始搜索量(39)加1变为40,为了使其达到100,我们将第一个请求中的所有时间序列的值乘以100/40=2.5。同样,由于第二个请求中2016年10月7日美国的搜索量在加1后为80,为了使其达到100,我们将第二个请求中的所有时间序列的值乘以100/80=1.25。然后,我们通过连接来自两个请求的相应时间序列,得到了从2016年3月7日至2017年4月14日的时间序列。通过重复这个过程,我们得到了一组时间0第一个请求+1(160307〜161007)0第二个请求+1(161007〜170414)0结果时间序列(160307〜170414)0X2.5 X1.250第一个请求(160307〜161007)第二个请求(161007〜170414)0+1 +1 将所有搜索量加10处理2016年10月7日的潜在零值0图1:时间序列连接的示意图0表示从一个国家到另一个国家的搜索量的时间序列。由于我们将一个国家的美国的搜索量作为参考,在从同一个国家构建每个时间序列时,该国家的所有结果时间序列具有相同的比例,因此可以进行比较。04 构建多重网络0多重网络具有多个层,每个层表示节点之间的不同类型的关系[20]。例如,电话呼叫、Facebook帖子或WhatsApp消息可以是表示不同类型社交互动的多重网络的不同层。类似地,我们构建了一个关于国家之间关注的多重网络。关注有两种类型:媒体关注和公众关注。前者通过新闻报道捕捉,后者通过网络搜索量捕捉。每个国家被映射为多重网络的一个节点,当一个国家对另一个国家的关注存在时,建立一个链接。链接权重表示关注的强度。04.1 媒体关注层0媒体关注被建模为一个国家对另一个国家的新闻报道。如果一个国家c i 的新闻媒体报道国家c j ,我们说媒体关注存在于国家c i 对国家c j。为了捕捉时间动态,我们在每天的基础上进行建模。在特定的第t天,媒体关注层中的网络(在其余部分称为媒体关注网络)由N Mt表示,只有当在第t天从c i 到c j 存在媒体关注时,才有从c i 到c j的链接。从c i 到c j 的链接的权重是c i 的新闻媒体发布的提到c j的新闻文章的数量。我们消除了自环,代表国内新闻。NL⟨k⟩CC∗α∗SCCρNM19323,965124.10.82-0.111.00.79NP19336,864191.00.99-0.990.99In this section, we compare the structural characteristics of themedia attention and the public attention.8960一旦我们获得了所有t∈T的N Mt,其中T是我们的数据收集周期,我们按照以下方式构建了聚合网络N M:1)如果一个节点或链接存在于任何N M t中,它也存在于N M 中;2)从c i 到c j的链接在N M 中的权重0是在N Mt中相同链接的权重之和,其中t∈T。由此产生的网络可能在国家之间有很多链接。考虑到各国媒体市场的不同规模,为了修剪网络,找到全局链接权重的阈值并不容易。因此,我们使用预定义置信水平的差异过滤器[41]来局部计算阈值以修剪网络。直观地说,该过滤器在每个节点上找到具有统计显著性的链接。差异过滤器发现的链接称为网络的骨干,用B(∙)表示。04.2 公众关注层0公众关注被建模为一个国家的人们对另一个国家进行的网络搜索。如果一个国家c j 的网络搜索是由居住在国家c i的人进行的,我们可以说公众关注存在于国家c i 对国家c j。类似于媒体关注网络的建模,公众关注层中的网络(在其余部分称为公众关注网络)由N P t表示,只有当在第t天从c i 到c j存在公众关注时,才有从c i 到c j 的链接。第t天上从c i 到c j的链接的权重是在第3.4节重新计算的c i 在t上对c j的搜索量。此外,N P 和B(N P )分别由所有t∈T的N Pt的聚合网络和N P 的骨干网络组成。04.3 注意力网络的基本特征0表1展示了媒体关注网络、公众关注网络以及它们的骨干网络的拓扑特征,包括节点数N、链接数L、平均度�k�、平均聚类系数CC、同配系数α[33]、最强连通分量的百分比SCC(%)和互惠性ρ)。上标�表示对应的度量值是从由原始网络的互惠链接组成的无向网络计算得出的。0B(N M ) 190 1,796 9.45 0.31 0.44 0.66 0.29 B(N P ) 1921,493 7.78 0.09 0.13 0.42 0.150表1:注意力网络的基本特征0骨干提取有效地修剪了网络。媒体关注网络和公众关注网络的骨干仅保留了7.50%和4.05%的链接。同配性显示了一个有趣的趋势。在NM 中,同配性是负的;然而,在其骨干网络B(N M)中,它是正的。这意味着在骨干网络中捕捉到的显著媒体关注在具有相似特征的国家之间交换。0度数因为 α > 0,但在一般的媒体关注交换中,由于 α ≈ 0,这种趋势并不明显。从N P转换成的无向网络由一个完全连接的网络和一个孤立节点(留尼汪)组成,N P中的同配性无法计算。骨干网络中的低互惠性揭示了显著的媒体和公众关注的非对称性。0在本节中,我们比较了媒体关注和公众关注的结构特征。05 媒体关注和公众关注之间的结构对齐05.1 中心性相关性0我们首先关注媒体关注网络和公众关注网络中的重要国家。如果一个国家受到其他国家的主要媒体关注,它是否也会受到公众的主要关注(反之亦然)?为了回答这个问题,我们比较了媒体关注网络和公众关注网络中国家的中心性。B(N M)和B(NP)之间的度中心性、中介中心性、特征向量中心性和接近中心性的Spearman相关系数分别为0.562、0.548、0.658和0.653(所有p <0.0001)。所有这些正系数显示了两者之间的中等正相关关系;受到高度媒体(公众)关注的国家通常也会受到高度公众(媒体)关注,但对齐并不完美。05.2 top@k邻居国家的重叠0节点中心性的正相关性暗示了媒体关注和公众关注之间的结构相似性。然后,自然而然的问题是是否在其他层面上也能找到这种结构相似性,比如dyadic级别。如果一个国家ci对另一个国家cj给予最高的媒体关注,那么ci对cj的最高公众关注是否也是如此?为了以稳健的方式回答这个问题,我们首先将问题更一般化,考虑从ci获得媒体(或公众)关注的前k个国家,我们称这些为ci的top@k邻居。例如,一个国家的top@1邻居是从该国家获得最多关注的国家,而top@10邻居是从该国家获得最多关注的前10个国家。然后,新的问题是N M和N P 之间的这些top@k邻居是否是共同的。图2显示了NM和N P 之间的top@k邻居的Jaccard系数的累积分布。0在dyadic级别上,媒体关注和公众关注的结构特征不同,与节点中心性的高相关性相反。在整个国家中,媒体和公众在63.2%的情况下对不同的国家给予最多关注(k=1),而在36.8%的情况下,他们对相同的国家给予最多关注。Jaccard系数的中位数分别为0.0、0.2、0.429和0.429,对应于k=1、3、5和10。这表明在dyadic级别上,媒体关注和公众关注存在结构上的差异;一个国家的媒体和公众通常对不同的国家感兴趣。在122个N M和N P的top@1邻居不同的国家中,27.0%的媒体最关注美国0Track: Web and Society WWW 2018, April 23-27, 2018, Lyon, France0.00.20.40.60.81.00.00.20.40.60.81.00.00.20.40.60.81.00.00.20.40.60.81.08970Jaccard系数0CDF0k=1k=3k=5k=100图2:N M和N P 之间top@k邻居的重叠0美国,其次是中国(8.1%),叙利亚(5.8%),埃及(4.1%)和英国(5%)。这些国家具有“新闻价值”,即媒体经常报道它们,但它们未能吸引类似数量的公众关注。这可以部分解释为媒体对美国的高度关注;在193个国家中,有64个国家的媒体最关注美国,但其中超过一半的国家的公众最关注其他国家,如德国和日本。相反,只有10个国家的公众最关注美国,而媒体关注其他国家。除了媒体对美国的重视外,我们还测试了两个已知影响新闻报道的因素,即国家之间的距离[47]和贸易量[53]。它们是否也会影响公众的关注度?首先,我们比较每个国家与其最重要邻国之间的距离,这是通过两个国家首都之间的距离来衡量的,在N M和N P 中通过Mann-WhitneyU检验发现没有显著差异(p值分别为0.18、0.16、0.30和0.16,对于k=1、3、5和10)。其次,我们编制了每个国家的主要出口和进口贸易伙伴的列表,并将其与N M和N P中的最重要邻国进行比较。我们排除了将“欧洲联盟”作为主要出口或进口贸易伙伴的国家,因为它是一个由多个国家组成的联盟,不是一个分析单位。因此,我们有一个包含114个国家的主要出口和进口贸易伙伴的列表。在其中,我们发现37个国家(32.5%)和34个国家(29.8%)在N M和N P中最关注其主要进口国或出口国。卡方检验未确认任何统计上显著的差异(p值=0.7749)。因此,国家之间的距离和贸易量对N M和NP之间的二元关系没有不同的影响。为了调查top@k邻居是否在时间上稳定,我们计算了N M和N P中top@k邻居的Jaccard系数的月度变化。当k=1、3、5和10时,中位数Jaccard系数分别为0.0、0.2、0.25和0.33,除了在6月(0.417)和7月(0.429)增加时,当k=10时。通过手动检查,我们发现这些峰值是由两个事件驱动的:2016年6月23日英国欧盟成员国公投(脱欧)和2016年7月14日尼斯恐怖袭击事件,导致86人死亡,458人受伤。在2016年6月,103个国家最关注英国的媒体和公众注意力,而英国的平均关注度数为02016年7月,125个国家将最高的媒体和公众关注度集中在法国,而其平均关注度仅为42.5。媒体关注在这两个时期的趋同性在[5]中已经报道过。我们还观察到了媒体关注和公众关注在“脱欧”和尼斯恐怖袭击事件周围的趋同性。在为期十四个月的数据收集期间,没有观察到媒体关注和公众关注之间的如此强烈的趋同性。05.3 关注平衡0在前一小节中,我们展示了媒体和公众关注在二元层面上的差异,特别关注前k个邻居,但一个国家的关注有多少流向前k个邻居?媒体和公众关注从一个国家到另一个国家有多么不平衡?为了回答这个问题,我们计算了每个节点的链接权重的基尼系数。0基尼系数0媒体公众0图3:N M 和N P 中每个节点的链接权重的基尼系数的累积分布0基尼系数衡量给定分布的统计离散度或不平等性。基本上,较高的系数表示更不平等或偏斜的分布。当给定分布是均匀的(完全平等)时,最小值为零,当给定分布是最大偏斜时,最大值为一。图3显示了N M 和N P 中每个节点的链接权重的基尼系数的累积分布。首先,NM 和N P中广泛的基尼系数意味着链接权重在各个国家之间相当多样化。一些国家,如也门(N M 中的0.92)或直布罗陀(N P中的0.80),只关注少数几个国家,但其他国家,如中非共和国(NM 中的0.17)和加拿大(N P中的0.13),对其他国家的关注相对均等。其次,N P中基尼系数的累积分布位于N M中的左侧。这表明公众关注比媒体关注更均等地流向其他国家。N P和N M中基尼系数的中位数分别为0.374和0.799。我们通过Mann-WhitneyU检验(U=1887.0,p值=6.0e-53)确认N P 和N M之间基尼系数的差异是显著的。从图3中我们预期的结果,N M 和NP中每个节点的基尼系数几乎没有相关性(Spearman相关系数ρ=-0.03,p值=0.669)。这是媒体和公众以不同方式关注其他国家的额外证据,它们专注于不同国家的不同强度。0Track: Web and Society WWW 2018, April 23-27, 2018, Lyon, France8980三个国家之间的关注流量0图4:B(N M)和B(N P)中13种模式的Z分数0通过对前k个邻居和链接权重的基尼系数的分析,我们可以观察到媒体关注和公众关注在二元层面上的结构差异。现在我们转向更复杂的分析单元,即三元组,有时被称为三个大小的模式。在有向网络中,根据它们的连接方式,有13种不同的三元组模式。图4的x轴显示了它们的列表。模式分析的直觉是每个13种不同模式的比例揭示了整个网络的特征[31]。例如,在社交网络中,完全连接的三元组(图中的第13个模式)比随机网络中过度表示,这是由于人类互动的互惠性质,而在食物网络中,前馈环路(FFL,图中的第5个模式)比随机网络中过度表示,这是由于食物链中的等级制度。我们使用Fan-mod[51]计算媒体关注网络和公众舆论网络的模式配置文件,并在图4中呈现每个模式的Z分数。正(负)Z分数意味着与空模型相比,相应的模式过度表示(欠表示),空模型是具有相同度分布的1,000个随机网络的集合。我们发现两个网络都显示出类似的模式配置文件;流入和流出模式被欠表示,FFL和双反馈环路模式(第6个模式)被过度表示,并且完全连接的模式被过度表示。考虑到我们在之前的实验中发现了媒体关注和公众关注之间明显的结构差异,它们的模式配置文件的良好对齐有些出乎意料。过度表示的FFL意味着网络中存在等级结构。像食物链一样,FFL显示出一种传递性等级制度。雅虎问答中的问答模式也显示出这种等级制度,因为高级专家可以回答简单和困难的问题,而初级专家只能回答简单的问题[2]。在媒体关注和公众关注网络中,形成FFL的国家的一个例子是[阿尔及利亚→法国,阿尔及利亚→美国,法国→美国]。阿尔及利亚的公众对法国和美国非常关注,法国的公众对美国非常关注,但美国的公众对它们两者都不太关注。同样,有影响力的国家(例如G8),如英国[卢森堡→比利时,卢森堡→英国,比利时→0英国]或日本[马来西亚→孟加拉国,马来西亚→日本,孟加拉国→日本]在两个关注网络中形成了许多FFLs。许多过度表现的全连接模式来自地理上相邻的国家,例如[巴西,阿根廷,巴拉圭],[克罗地亚,波斯尼亚和黑塞哥维那,塞尔维亚]和[中国,香港,澳门]。由于相邻国家很可能共享语言、历史或文化相似性,他们的媒体和公众关注彼此是合理的。05.5 地区之间的关注流动0在这里,我们将地理信息作为节点属性添加到网络中,以从关注流中提取有意义的模式。虽然在新闻报道中发现了强烈的地区主义[21],但最近的研究也报告了“全球村庄”的趋势,数十个国家之间的媒体关注超越了地区块[22]。那么,哪种观点更准确地描述了我们数据收集中捕捉到的媒体关注和公众关注?通过比较不同地区之间如何交换媒体关注和公众关注,我们旨在洞察世界中的关注流动。0(a) 媒体关注0(b) 公众关注0图5:N M和N P中地区之间的关注流动。行是源地区,列是目标地区。流量在每个源地区内进行了归一化。0图5显示了从源地区(行)到目标地区(列)的归一化关注流动。我们将行的总和归一化为1。如表中所示,我们发现媒体关注和公众关注之间存在一些相似性和差异。首先,在两者中都可以找到强烈的地区主义,但强度略有不同。就媒体关注而言,亚洲和欧洲对自己的关注最多,其他地区次之。相比之下,就公众关注而言,除大洋洲外,所有地区对自己的关注最多。其次,亚洲作为媒体关注的接收者的出现是显著的,而在公众关注中则不可见。除了欧洲外,所有地区都对亚洲给予了最高水平的关注,甚至欧洲也给予了第二高水平的关注。最后,公众的关注更加平等,而媒体的关注则不然。这是我们在第5.3节中在国家层面上发现的,也在地区层面上再次观察到。媒体和公众的基尼系数分别为0.439(欧洲)和0.317(美洲)。我们通过Mann-Whitney的U检验确认了差异的统计学显著性(U=3.0,p值=0.030)。0主题:Web和社会WWW 2018,2018年4月23日至27日,法国里昂In the previous section, we use a geographical boundary as a notionof a group of countries and look into attention within and acrossthe groups. Now we find groups of countries based on the actualattention flow by a community identification method. The resultinggroups can reveal an embedded modular structure of the mediaattention and the public attention networks.8990在前一节中,我们将地理边界作为国家组的概念,并研究了组内和组间的关注。现在,我们根据实际关注流通过社区识别方法找到了国家组。所得到的组可以揭示媒体关注和公众关注网络的嵌入模块化结构。05.6 网络中的社区结构0(a) 媒体关注0(b) 公众关注0(c) Huntington提出的文明0图6:骨干网络中的社区结构0在各种社区识别方法中,我们使用基于随机游走的In-foMAP[39],可以自然地结合链接的方向。我们在图6(a)和(b)中可视化了B(NM)和B(NP)中识别出的社区。同一社区的国家被涂成相同的颜色。在B(NM)和B(NP)中分别发现了16个和14个社区。从图中可以看出,最大社区的覆盖范围是最主要的区别。在B(NM)中,有一个由80个国家组成的巨大社区,包括欧洲、中东、北美等世界各地的国家。0并且非洲,展示了之前在[22]中报道的媒体关注的“全球村”趋势。虽然这些国家在最大社区中的成员身份与[22]略有不同,但媒体关注不局限于地理区域而是在全球范围内交流的模式是一致的。相比之下,B(NP)中最大的社区有42个国家,主要由欧洲和大洋洲国家组成。其他地区没有国家被包括在B(NP)中最大的社区中。相反,地区间的分割是明显的,公众关注在这些地区之间交流。有趣的是,一些地理上相邻的国家组成了亨廷顿[15]提出的“文明”的概念。他认为,共享文化和宗教身份的“文明”对于理解后冷战时代的冲突至关重要。他的文明概念已被广泛用于理解世界的分裂,例如在[34]中。图6(c)显示了文明的地图。我们可以看到,一些文明以B(N M)和B(NP)中的已识别社区的形式出现,只是增加或减少了一些国家。揭示这种细粒度的变化与90年代末提出的文明起源的研究挑战。亨廷顿发现的文化界线是否由于连接性和全球化趋势而发生变化?媒体关注和公众关注的核心仍然一致地观察到文明的有效性,但全球村的趋势和其他变化需要新的模型和解释来解释当今的国际关系。06 媒体关注和公众关注之间的相互作用0我们已经展示了不同层面上媒体关注和公众关注之间的结构相似性和差异性。然后我们转向这些关注之间的相互作用。06.1 Granger因果分析0Granger因果关系是两个时间序列之间的因果关系的统计概念。当一个时间序列 T X Granger-cause 另一个时间序列 T Y时,相对于仅使用 T Y 的过去值时,使用 T X的过去值可以更好地解释 T Y的当前值。由于计算简单,Granger因果关系已被广泛用于因果分析。我们的目标是检查媒体关注是否Granger-cause公众关注,公众关注是否Granger-cause媒体关注,或两者都是。为了实现这一目标,对于在 N M 和 N P中都存在的每对国家,我们构建了代表媒体关注和公众关注的两个时间序列。我们用 T c i → c j M 表示从国家 c i 到国家 c j的媒体关注的时间序列,用 T c i → c j P 表示从国家 c i 到国家 c j的公众关注的时间序列。为了检查媒体关注是否Granger-cause公众关注,零假设是 T c i → c j M 不Granger-cause0T c i → c j P。我们测试了从1到14天的不同时间滞后的假设。当 p-value < 0.05时,我们拒绝假设,并称媒体关注以时间滞后 lGranger-cause公众关注。如果两个时间序列显示出多个 l的Granger-cause关系,我们选择具有最大 F 统计量(最小 p-value)的 l 。对于公众关注Granger-cause媒体关注的情况,0Track: Web and Society WWW 2018,2018年4月23日至27日,法国里昂AfricaAmericasAsiaEuropeOceaniaWho pays attentionAfricaAmericasAsiaEuropeOceaniaWho gets attention100200300400500600700800900AfricaAmericasAsiaEuropeOceaniaWho pays attentionAfricaAmericasAsiaEuropeOceaniaWho gets attention100200300400500AfricaAmericasAsiaEuropeOceaniaWho pays attentionAfricaAmericasAsiaEuropeOceaniaWho gets attention1002003004005006007008009000(a) 媒体Granger-cause公众0(b) 公众Granger-cause媒体0(c) 双向关系0图7:地区之间的Granger因果关系0零假设是 T c i → c j P 不Granger-cause T c i → c jM,其余过程相同。对于假设检验,我们注意到我们通过适当的转换技术(如差分)使时间序列平稳。在37,056个国家对中,我们发现媒体关注在2,594个国家对中Granger-cause公众关注,公众关注在5,817个国家对中Granger-cause媒体关注。此外,在6,698个国家对中,我们发现两个方向上都存在Granger因果关系。我们在图7中展示了这些关系的地理分布。图7(a)显示了媒体关注Granger-cause公众关注的国家对,(b)显示了公众关注Granger-cause媒体关注的国家对,(c)显示了同时具有Granger因果关系的国家对((a)和(b)的交集)。通过将图7与图5中的地区之间的关注流进行比较,我们可以看到一些相似之处和不同之处。在图7(c)中,我们可以看到当关注集中在同一地区的国家时,媒体关注和公众关注之间存在更强的关联。同一地区内的媒体关注或公众关注不仅高于跨地区的关注(图5),而且很可能Granger-cause其对应的关注。然而,从一个地区到另一个地区的媒体(或公众)关注的较高数量并不能保证它在相应的地区对中Granger-cause更多的公众(或媒体)关注。这种媒体关注和公众关注之间的不一致与之前比较新闻文章和新闻评论的研究一致[1]。然后,我们研究了决定Granger因果关系的因素。为此,我们建立了一个随机
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Fisher Iris Setosa数据的主成分分析及可视化- Matlab实现
- 深入理解JavaScript类与面向对象编程
- Argspect-0.0.1版本Python包发布与使用说明
- OpenNetAdmin v09.07.15 PHP项目源码下载
- 掌握Node.js: 构建高性能Web服务器与应用程序
- Matlab矢量绘图工具:polarG函数使用详解
- 实现Vue.js中PDF文件的签名显示功能
- 开源项目PSPSolver:资源约束调度问题求解器库
- 探索vwru系统:大众的虚拟现实招聘平台
- 深入理解cJSON:案例与源文件解析
- 多边形扩展算法在MATLAB中的应用与实现
- 用React类组件创建迷你待办事项列表指南
- Python库setuptools-58.5.3助力高效开发
- fmfiles工具:在MATLAB中查找丢失文件并列出错误
- 老枪二级域名系统PHP源码简易版发布
- 探索DOSGUI开源库:C/C++图形界面开发新篇章
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功