4.
复杂性的基本度量
在本节中,我们考虑可以用于描述研究中使用的图形的大小度
量
考虑图形可视化的复杂性时,可以使用许多措施。然而,我们发
现,在关于图形研究设计和方法的报告中,通常很少考虑。节点数
量是最常报告的测量。另一方面,边缘的数量和
/
或密度不太频繁地
被 提 供
-
尽 管 已 知 其 是 重 要 因 素 (
Ghoniem
等 人 ,
2011
) 。 ,
2005
)。更多的边缘,不可避免地导致更多的边缘交叉,这是众所
周知的影响可读性(采购,
1997
年
a
)。当数据随时间变化时(即动
态图),其他度量( 如时间片数量)对于衡量复杂性变得同样重
要。
由于我们的兴趣主要是关于网络可视化的可扩展性的研究结果,
我们报告了研究中考虑的图形大小的分布。表
2
总结了这些指标的最
小值、最大值、平均值、中位数和上
/
下四分位数。虽然所有这些指
标的范围都很大,但在每种情况下,中位数都更接近最小值。这种
偏态分布意味着大多数研究使用小图。
为了更好地了解尺寸范围, 在用户研究之间和内部使用的图形
中,我们为每个研究绘制了每个研究中使用的最小图形和最大图形
的节点数与边数的 关 系 图 (图
1
和图
2
)。
1
、第
2
段)。每个最小
值和最大值对由一个链接连接,该链接显示该研究中评估的图形大
小范围。圆圈是:如果作者没有提到节点和边的数量,则为空心
;
如
果只提到节点的数量,则为双封闭 如果提到了节点和边的数量,
或者两个度量都是明显的(例如,如果给出了节点的数量
n
并且图形
类型是树,则我们假设存在
n-1
个边)。在没有提到信息的情况下,
我们根据图估计了图的大小(例如,
Zhao et al.
(
2016
),
Schökee
et al.
(
2016
),
Okoe
和
Jianu
(
2015
),
Ziemkiewicz
和
Kosara
(
2009
),
Bridgeman
和
Tamassia
(
2000
),
Burch et al.
(
2011
a
),
Kieffer et al.
(
2015
),
van Ham
和
Rogowitz
(
2008
),
Tennekes
和
de Jonge
(
2014
),
Giacomo et al.
(
2007
)、
Ziemkiewicz
和
Kosara
(
2008
)和
Tanahashi
等人(
2016
))。我们
还使用圆圈的色调来区分静态和动态图形。
在没有提供精确尺寸的地方,我们尽最大努力推断出近似尺
寸。例如,在某些情况下,我们能够从图中估计图的大小(
Zhao
et al.
,
2016
年
; Schönovelet al.
,
2016; Okoe and Jianu
,
2015;
Ziemkiewicz and Kosara
,
2009; Bridgeman and Tamassia
,
2000; Burch et al.
,
2011 a; Kieffer et al.
,
2015; van Ham and
Rogowitz
,
2008; Tennekes and de Jonge
,
2014; Giacomoet
al.
,
2007; Ziemkiewicz and Kosara
,
2008; Tanahashiet al.
,
2016年)。
下面的小节更详细地讨论了表2中的四个度量中的每一个
4.1.
数量的节点
图中节点的数量是复杂性的一个重要但很明显,对于大多数任
务来说,难度会受到向连通图引入更多节点的影响。我们可以假
设,大多数实验者都会尝试,或者至少会考虑使用不同节点数的
图,以避免过于琐碎或不可能完成的任务然而,在本次调查涵盖
的152项研究中,有28项研究根本没有提到节点计数。
在我们调查中包含的研究中,15项研究使用了超过1000个节点
的图(Marner et al. ,2014; Wongetal. , 2006; Borkin et al. ,
2013; Nekrasovski et al. ,2006; DunneandShneiderman,2013;
Archambault et al. ,2010; Zimmer和
Kerren, 2015; Ware and Bobrow , 2005; Tu and Shen, 2008;
Wuet al.
,
2017; Liu et al.
,
2017; Kwon et al.
,
2018;Yoghourdjian 等人,2018年)和另外九个使用超过500个
节点的图(
Moscovich et al.
,
2009; Lee and Archambault
,
2016;
Okoeet al.
,
2014; Jianu et al.
,
2014; Yuan et al.
,
2012;
Purchase et al.
,
2012 b; Yoghourdjian
等 人 ,
2018;Srinivasan
and Stasko,2018)。
在这些研究中,大多数的目的是评估使用交互式探索来提取零
件的工具(20/24项研究,83%)。这些研究中的一些评估聚合技
术,因此它们需要具有大量节点的图,以突出将多个节点压缩成
更少表示的益处。
在交互性存在的情况下,推断图形视觉化的认知可扩展性是有
问题的,因为大多数这些研究没有要求参与者在整个图形上执行
任务相反,只有一部分图形是可见的。当作者没有报告用户实际
可见的节点的精确数量时,几乎无法推断出认知可扩展性。在这
24
项研究中,有
8
项研究在评估中使用了节点少于
100
个的较小网
络 这是由长线显示(图。
1
,
2
)连接相同研究使用的不同图形大
小。
为了理解节点数量的选择,我们绘制了节点数量的直方图 图图
3显示了特定数量的节点周围的一些尖峰:20、50和100。最大的
峰值出现在
50
个节点的图上,
18
项研究,其次是
20
项和
100
项,
分别用于
16
项和
14
项研究。我们认为,这些整数的峰值表明实验
者任意选择了节点的数量。这些轮数没有确定的实证研究和正式
的研究天花板和地板的影响,图形认知的可扩展性可能会导致更
好的选择节点的数量
另外九项研究使用了超过200个节点的图表与上述类似,这些
研究中的一些只显示了网络的子部分(Ware et al. ,2008; Cypko
et al.
,
2017; Kwon et al.
,
2016; Okoe et al.
,
2017
年),而一
些评估工具,规模以及与大型网络(Ware et al. ,2008; Cypko et
al. ,2017; Kwonet al. ,2016; Holten et al. ,2011; Giacomo et
al.
,
2013; Burch et al.
,
2011a
,
2013; Greffard et al.
,
2011
年)。在这
9
项研究中,有
4
项使用了节点数少于
100
的网络。
总而言之,
152
项研究中只有
56
项使用了超过
100
个节点的图
表。大多数使用大量节点的研究,使用抽象或聚合来一次只显示
图的一部分,但不报告在给定抽象中看到的节点数量一般来说,
目前尚不清楚为什么大多数研究人员选择使用100个节点或更少的
图(
121/152
研究,
80%
)。一些作者提到了试点研究,他们发现
了天花板或地板效应,这可以被视为认知能力的指标我们在第
6.1
节中对此进行了讨论
;
然而,据我们所知,未进行对照研究来验证
或解释这些影响。
4.2.
边数
图中边的数量也是复杂性的一个重要指标,特别是在节点链接图
中,其中边被绘制为线。大量的边缘需要增加交叉和重叠的数量(共
线,因此是模糊的线)。过多的链接往往会导致所谓的
“
毛团
”
可视
化。在本次调查涵盖的
152
项研究中,
124
项明确提到了节点的数量,
而只有
87
项指定了边的数量。
只有28项研究使用了有1000条边的图 个或多个.其中大多数允
许参 与者查 看网络的 一部分, 而不是 在整个网 络上执 行任务
(
Nekrasovski et al.
,
2006; Dunne and Shneiderman
,
2013;
Archambault et al.
,
2010; Ware and Bobrow
,
2005; Liu et
al.
,
2017
年
;