复杂网络可视化：实证研究与可读性探索

144 浏览量更新于2024-06-17 收藏 2.19MB PDF 举报

"复杂网络的可视化: 实证研究综述" 这篇文章是对复杂网络可视化的实证研究进行的一次深入综述，主要关注于理解和评估在实际应用中，各种功能和特性如何影响网络的可读性和可伸缩性。随着信息技术的发展，网络数据变得越来越大、越来越复杂，对这些数据的有效可视化成为了挑战。作者们来自多个国际知名高校，他们探讨了图形可视化领域中的关键问题，尤其是当面对大规模数据集时，如何确保图形的可读性和人类理解的效率。网络可视化是一个重要的研究领域，旨在通过图形表示来揭示复杂网络的结构和模式，如社交网络、生物网络、互联网等。传统的可视化技术在处理大型数据集时可能面临局限，因为它们可能超出人类的认知和感知能力。因此，文章重点关注了可视化可伸缩性，即工具能否有效地展示大量数据，同时保持易读性。文章引用了Eick和Karr（2002）的观点，将可视化可伸缩性定义为能够清晰显示大规模数据集的能力。影响这一能力的因素包括人类的感知能力、显示器的分辨率、视觉隐喻、交互性、数据结构、算法以及计算基础设施。Jankun-Kelly等人（2014）进一步区分了感知可扩展性和认知可扩展性，前者涉及视觉呈现的物理限制，而后者关注的是用户理解和解析信息的心理过程。作者们对过去的人为参与实验进行了调查，这些实验旨在衡量不同布局和表示方法对网络可读性的影响。他们分析了各种网络可视化技术，比如节点链接图、矩阵表示、力导向布局等，探讨了这些技术在处理复杂网络时的优势和不足。此外，文章还可能涵盖了关于交互性在可视化中的作用，例如，动态调整视图、选择性显示和过滤等方法如何帮助用户更有效地探索复杂网络。同时，可能也讨论了新兴的技术和方法，如多层次可视化、基于上下文的可视化以及利用人工智能和机器学习增强可视化的尝试。总结起来，这篇综述为理解复杂网络可视化提供了宝贵的见解，不仅概述了现有的研究成果，也指出了未来研究的方向，包括如何进一步提高网络可视化的效率和有效性，以及如何设计出更适应人类认知的可视化工具和技术。对于从事信息可视化、数据科学、网络分析和人机交互研究的人员来说，这是一篇重要的参考文献。

268
诉
Yoghourdjian
，
D.Archambault
，
S.Diehl
等人
/
视觉信息学
2
（
2018
）
264
−
4.
复杂性的基本度量
在本节中，我们考虑可以用于描述研究中使用的图形的大小度
量
考虑图形可视化的复杂性时，可以使用许多措施。然而，我们发
现，在关于图形研究设计和方法的报告中，通常很少考虑。节点数
量是最常报告的测量。另一方面，边缘的数量和
/
或密度不太频繁地
被 提 供
-
尽 管 已 知 其 是 重 要 因 素 （
Ghoniem
等 人 ，
2011
） 。 ，
2005
）。更多的边缘，不可避免地导致更多的边缘交叉，这是众所
周知的影响可读性（采购，
1997
年
a
）。当数据随时间变化时（即动
态图），其他度量（ 如时间片数量）对于衡量复杂性变得同样重
要。
由于我们的兴趣主要是关于网络可视化的可扩展性的研究结果，
我们报告了研究中考虑的图形大小的分布。表
2
总结了这些指标的最
小值、最大值、平均值、中位数和上
/
下四分位数。虽然所有这些指
标的范围都很大，但在每种情况下，中位数都更接近最小值。这种
偏态分布意味着大多数研究使用小图。
为了更好地了解尺寸范围， 在用户研究之间和内部使用的图形
中，我们为每个研究绘制了每个研究中使用的最小图形和最大图形
的节点数与边数的 关 系 图 （图
1
和图
2
）。
1
、第
2
段）。每个最小
值和最大值对由一个链接连接，该链接显示该研究中评估的图形大
小范围。圆圈是：如果作者没有提到节点和边的数量，则为空心
;
如
果只提到节点的数量，则为双封闭 如果提到了节点和边的数量，
或者两个度量都是明显的（例如，如果给出了节点的数量
n
并且图形
类型是树，则我们假设存在
n-1
个边）。在没有提到信息的情况下，
我们根据图估计了图的大小（例如，
Zhao et al.
（
2016
），
Schökee
et al.
（
2016
），
Okoe
和
Jianu
（
2015
），
Ziemkiewicz
和
Kosara
（
2009
），
Bridgeman
和
Tamassia
（
2000
），
Burch et al.
（
2011
a
），
Kieffer et al.
（
2015
），
van Ham
和
Rogowitz
（
2008
），
Tennekes
和
de Jonge
（
2014
），
Giacomo et al.
（
2007
）、
Ziemkiewicz
和
Kosara
（
2008
）和
Tanahashi
等人（
2016
））。我们
还使用圆圈的色调来区分静态和动态图形。
在没有提供精确尺寸的地方，我们尽最大努力推断出近似尺
寸。例如，在某些情况下，我们能够从图中估计图的大小（
Zhao
et al.
，
2016
年
; Schönovelet al.
，
2016; Okoe and Jianu
，
2015;
Ziemkiewicz and Kosara
，
2009; Bridgeman and Tamassia
，
2000; Burch et al.
，
2011 a; Kieffer et al.
，
2015; van Ham and
Rogowitz
，
2008; Tennekes and de Jonge
，
2014; Giacomoet
al.
，
2007; Ziemkiewicz and Kosara
，
2008; Tanahashiet al.
，
2016年）。
下面的小节更详细地讨论了表2中的四个度量中的每一个
4.1.
数量的节点
图中节点的数量是复杂性的一个重要但很明显，对于大多数任
务来说，难度会受到向连通图引入更多节点的影响。我们可以假
设，大多数实验者都会尝试，或者至少会考虑使用不同节点数的
图，以避免过于琐碎或不可能完成的任务然而，在本次调查涵盖
的152项研究中，有28项研究根本没有提到节点计数。
在我们调查中包含的研究中，15项研究使用了超过1000个节点
的图（Marner et al. ，2014; Wongetal. ， 2006; Borkin et al. ，
2013; Nekrasovski et al. ，2006; DunneandShneiderman，2013;
Archambault et al. ，2010; Zimmer和
Kerren， 2015; Ware and Bobrow ， 2005; Tu and Shen， 2008;
Wuet al.
，
2017; Liu et al.
，
2017; Kwon et al.
，
2018;Yoghourdjian 等人，2018年）和另外九个使用超过500个
节点的图（
Moscovich et al.
，
2009; Lee and Archambault
，
2016;
Okoeet al.
，
2014; Jianu et al.
，
2014; Yuan et al.
，
2012;
Purchase et al.
，
2012 b; Yoghourdjian
等 人 ，
2018;Srinivasan
and Stasko，2018）。
在这些研究中，大多数的目的是评估使用交互式探索来提取零
件的工具（20/24项研究，83%）。这些研究中的一些评估聚合技
术，因此它们需要具有大量节点的图，以突出将多个节点压缩成
更少表示的益处。
在交互性存在的情况下，推断图形视觉化的认知可扩展性是有
问题的，因为大多数这些研究没有要求参与者在整个图形上执行
任务相反，只有一部分图形是可见的。当作者没有报告用户实际
可见的节点的精确数量时，几乎无法推断出认知可扩展性。在这
24
项研究中，有
8
项研究在评估中使用了节点少于
100
个的较小网
络 这是由长线显示（图。
1
，
2
）连接相同研究使用的不同图形大
小。
为了理解节点数量的选择，我们绘制了节点数量的直方图 图图
3显示了特定数量的节点周围的一些尖峰：20、50和100。最大的
峰值出现在
50
个节点的图上，
18
项研究，其次是
20
项和
100
项，
分别用于
16
项和
14
项研究。我们认为，这些整数的峰值表明实验
者任意选择了节点的数量。这些轮数没有确定的实证研究和正式
的研究天花板和地板的影响，图形认知的可扩展性可能会导致更
好的选择节点的数量
另外九项研究使用了超过200个节点的图表与上述类似，这些
研究中的一些只显示了网络的子部分（Ware et al. ，2008; Cypko
et al.
，
2017; Kwon et al.
，
2016; Okoe et al.
，
2017
年），而一
些评估工具，规模以及与大型网络（Ware et al. ，2008; Cypko et
al. ，2017; Kwonet al. ，2016; Holten et al. ，2011; Giacomo et
al.
，
2013; Burch et al.
，
2011a
，
2013; Greffard et al.
，
2011
年）。在这
9
项研究中，有
4
项使用了节点数少于
100
的网络。
总而言之，
152
项研究中只有
56
项使用了超过
100
个节点的图
表。大多数使用大量节点的研究，使用抽象或聚合来一次只显示
图的一部分，但不报告在给定抽象中看到的节点数量一般来说，
目前尚不清楚为什么大多数研究人员选择使用100个节点或更少的
图（
121/152
研究，
80%
）。一些作者提到了试点研究，他们发现
了天花板或地板效应，这可以被视为认知能力的指标我们在第
6.1
节中对此进行了讨论
;
然而，据我们所知，未进行对照研究来验证
或解释这些影响。
4.2.
边数
图中边的数量也是复杂性的一个重要指标，特别是在节点链接图
中，其中边被绘制为线。大量的边缘需要增加交叉和重叠的数量（共
线，因此是模糊的线）。过多的链接往往会导致所谓的
“
毛团
”
可视
化。在本次调查涵盖的
152
项研究中，
124
项明确提到了节点的数量，
而只有
87
项指定了边的数量。
只有28项研究使用了有1000条边的图 个或多个.其中大多数允
许参 与者查 看网络的 一部分， 而不是 在整个网 络上执 行任务
（
Nekrasovski et al.
，
2006; Dunne and Shneiderman
，
2013;
Archambault et al.
，
2010; Ware and Bobrow
，
2005; Liu et
al.
，
2017
年
;