没有合适的资源?快使用搜索试试~ 我知道了~
视觉信息学4(2020)1交互式可视化数据的散点图评价Quang Vinh Nguyena,b,Nguyen,Natalie Millerc,David Arnessc,Weidong Huangd,毛林黄e,西蒙西莫夫a,ba澳大利亚西悉尼大学MARCS研究所b澳大利亚西悉尼大学计算机、数据和数学科学学院c澳大利亚西悉尼大学心理学院d澳大利亚悉尼科技大学跨学科创新学院e澳大利亚悉尼科技大学信息技术工程学院软件学院ar t i cl e i nf o文章历史记录:接收2七月2020收到修订版2020年9月17日接受2020年2020年9月26日网上发售保留字:多变量数据可视化多维数据可视化散点图对照研究a b st ra ct散点图和散点图矩阵方法已广泛用于显示统计图形和揭示多元数据中的模式。最近的一项技术,称为Linkable Scatterplots,为交互式视觉探索提供了一个有趣的想法,它提供了一组必要的绘图面板,以及交互,链接和刷。本文介绍了一项采用混合模型设计的对照研究,以评价使用顺序散点图(一次显示一个散点图)、多个散点图(可以指定和显示图的数量)和同时散点图(所有图均显示为散点图矩阵)时视觉探索的有效性和用户体验。研究结果表明,使用多重散点图可视化具有更高的准确性,特别是与同时散点图相比。虽然在多重散点图技术中完成任务所需的时间较长,但与更简单的顺序散点图相比,多重散点图本质上更准确。此外,多重散点图技术是本研究中最受欢迎和经验最丰富的技术。总体而言,结果支持多重散点图的优势,并突出其作为探索多变量数据的有效数据可视化技术的©2020作者(S)。由爱思唯尔公司出版我代表浙江大学和浙江大学出版社有限公司这是一个在CC BY-NC-ND许可证下的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。1. 介绍散点图已经被认为是用于在成对轴中显示低维数据的相关性和模式的通用、多态和通常有用的技术之一(Friendly和Denis,2005; Packham等人,2006)。,2005)以及大量数据的概述(Sedlmair et al. ,2013)。不幸的是,散点图技术不能很好地处理具有高维度或大量项目的数据集。数据点的过标和重叠可能会妨碍信息的准确提取(Cleveland和McGill,1984)。通过协同任务、数据和设计来识别和增强上述问题,以创建有效的散点图设计框架(Sarikaya et al. ,2018年)。散点图矩阵表示单个矩阵形式上的所有成对的具有所有属性的*函授:澳大利亚新南威尔士州帕拉马塔西悉尼大学计算机、数据和数学科学学院。电子邮件地址:Q. westernsydney.edu.au(Q. V. Nguyen),Natmill303@gmail.com(N.Miller),D. westernsydney.edu.au(D.Arness),黄卫东@ uts.edu.au(W。Huang),Mao. uts.edu.au(M.L.Huang),S.westernsydney.edu.au(S.Simoff)。https://doi.org/10.1016/j.visinf.2020.09.004在这种结构中映射意味着更容易横向和纵向扫描,以评估多个变量之间关系的差异,并在维度之间进行比较(Cleveland 和McGill,1984)。然而,在上半部分和下半部分的重复比较对,以及空白的对角面板,导致矩阵显示器内的大量冗余虽然空对角线图可以用于呈现直方图或其他信息(Cui et al. ,2006),传统的散点图矩阵技术可能不提供交互式功能,例如链接、刷涂和放大视图,其涉及在多个散点图显示面板上突出显示Nguyen等人利用可链接散点图技术扩展了单散点图和散点图矩阵技术的可能性(Nguyen等人,,2013,2016 b),其已经用于基因组数据分析中的各种数据集(Nguyen et al. ,2014,2016a)。它提供了灵活性和对用户界面的控制,以及许多绘图和可视化映射,以便可以以最符合用户数据探索目标的方式进行安排根据所表示的数据的性质和用户的意图,这种技术可以提供比单个散点图更多的图面板,并减少不必要的图的数量-这是2468- 502 X/©2020作者。由爱思唯尔公司出版代表浙江大学和浙江大学出版社。这是一个在CC BY-NC-ND许可证下的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表视觉信息学期刊主页:www.elsevier.com/locate/visinfQ.V. Nguyen,N. 米勒,D。 Arness等人视觉信息学4(2020)12+→→→散点图矩阵方法,这可能有助于认知超载。交互式可视化的口头禅首先概述,然后允许过滤,最后按需提供细节(Shneiderman,1996; Wang et al. ,2015),这提出了有趣的研究问题,与传统的分析性能相比,选择散点图、视觉映射和交互选项的数量的灵活性是否会提供优于分析性能的性能。这种交互可以细化可视化,并有助于在散点图可视化中进行深度视觉探索和信息发现(Ware,2004)。然而,缺乏的实证研究,以评估散点图方法的性能和用户体验。本文对三种类型的散点图可视化进行了实证研究,它们分别是顺序散点图、同时散点图和多重散点图。序贯-散点图方法显示多维数据,一系列单独的散点图,每次只显示一个散点图。同时(Simultaneous)-散点图以多个散点图同时显示所有数据变量。与同时散点图相比,多重散点图在选择多个散点图和视觉交互选项方面具有更大的灵活性从根本上说,这种评估是基于散点图的拟议优势,并通过人类认知和数据可视化之间的内在联系来提供信息。本研究调查了与传统的单一和散点图矩阵相比,多重散点图是否会导致更有效(完成任务所需的时间)和更准确的多变量数据探索,在那些被确定为几乎没有散点图解释经验的人中,以及那些具有中等数量散点图解释经验的人中。更具体地说,该研究评估了视觉映射,交互和按需提供多重散点图中的绘图面板的灵活性是否有助于用户性能。本研究还探讨了用户的喜好和经验的互动与每一个散点图相关的可视化技术。本研究评价了以下假设:H1。选择多个视觉图的灵活性和多重散点图中更大的交互能力可以帮助参与者在可视化过程中更有效地执行视觉搜索和比较(即时间和准确性)。H2。有经验和新手组的参与者之间的性能差异。H3.使用散点图可视化技术时,多个散点图可以改善用户体验和偏好。2. 散点图可视化散点图仍然是一种强大的方法,因为它简单易行,可以可视化维数较低的数据。他们对于视觉搜索,比景观可视化更有效(Tory et al. ,2007)和视觉记忆(Tory et al. ,2009),特别是在研究两个变量之间的相关性时。然而,当维数以及数据点的数量增加时,这些元素的有效性决定了。散点图已被广泛研究,用于非降维(Baldridge,2010)和降维数据(Sedlmair et al. ,2013)。2.1. 散点图矩阵散点图矩阵允许在图面板矩阵中显示所有属性的成对变量 一些最近的作品,如Scatterdice(Elmqvist et al. ,2008),提供交互和刷动以支持更好地探索数据。然而,在这方面,散点图矩阵可视化由于轴上的单一类型映射而不容易呈现类别值。这限制了可视化通常包含不同变量类型的大型多维多变量数据时的有效性。散点图矩阵有几种变体,以及与其他可视化技术的组合。散点图矩阵可以与平行坐标可视化集成,以检查维度和坐标之间的相关性(Albuquerque et al. ,2009; Heinrich et al. ,2012)。散点图矩阵可以通过整合变量类型的不同可视化技术来概括,例如连续变量对的散点图,分类变量对的热图和分类和连续变量对的条形图(Emerson et al. ,2013; Im et al. ,2013)。虽然广义散点图矩阵技术在某些任务上优于散点图矩阵(Im et al. ,2013),它们还遵循矩阵概念以同时显示所有成对的属性。当可视化具有大量维度和数据项的大数据集时,这可能会出现问题。散点图矩阵可视化中存在未使用的显示空间,并且显示图的数量很高,但并非所有都有用,这使得每个图面板太小,无法有效显示大量信息。2.2. 多重散点图多重散点图技术,如可链接散点图(Nguyen et al. ,2016年b),可以提供灵活性,分析师在选择的绘图面板的数量,坐标轴上的变量映射,以及视觉属性。通过同时显示选定的变量,可以更有效地比较有限空间内变量的相关性,同时减少所有信息作为散点图矩阵的不必要和拥挤的呈现。这种技术还提供了几种与信息交互的方式,包括突出显示,过滤,选择,链接和刷,修改视觉属性或显示回归线。例如 图图1显示 了一 个可链 接散 点图https://rdrr.io/rforge/Ecdat/man/Crime.html该数据集有24个混合数值和分类值的属性。在当前探索阶段,图面板1至图面板6上的x轴和y轴上的映射分别是(每平方英里的人口,每人所犯的罪行)、(逮捕概率,每人所犯的罪行)、(逮捕概率,年轻男性的百分比)、(人均税收,地方政府雇员的每周工资)、(人均税收,国家雇员的每周工资)和(人均税收,联邦雇员的每周工资颜色映射到区域(红色中央,蓝色西部和绿色其他),形状映射到年份(1981至1987年)。回归线被打开以帮助变量之间的相关性。目前的可视化只显示了三年的数据,包括1981年(O形),1984年(U形)和1987年(形)。图1的顶部三个绘图面板。1表明,与中部地区和其他地区相比,西部地区的人均犯罪率往往最低。该图还显示了相关性,即每平方英里人口越多,人均犯罪率越高(见散点图1),年轻男性的百分比可能会适度增加人均犯罪率(见图3)。图1底部的三个图用于分析地方、州和联邦政府的人均税收与雇员周工资之间的相关性。图Q.V. Nguyen,N. 米勒,D。 Arness等人视觉信息学4(2020)13=Fig. 1. 这 是 一个关于1981-1987年期间北卡罗来纳州犯罪的六个小组的散点图可视化的 例 子 。1981年、1984年和1987年的工资增长。三个地区的工资没有差别。它有趣的是,当地方和州雇员的周工资较高时(见散点图4和5),与联邦雇员的周工资(见图6)相比,人均税收收入增长得更快3. 对照研究可视化技术的价值应该通过它在多大程度上促进了对数据中包含的故事的简单,高效,准确和有意义的解释来评估(少数,2013)。这项对照研究遵循最常见的数据可视化可用性方法,通过性能指标进行评估,特别是响应时间和准确性(Huang etal. ,2008,2009)。使用这些方法是因为人们普遍认为,卓越的可视化应该有助于更快、更准确地解释数据(Zhu,2007)。除了性能指标外,还使用主观指标评估可用性,特别是通过了解用户对数据可视化技术的实用性和功能性的意见,以及他们对使用特定技术的偏好(Huang et al. ,2008;Zhu,2007)。我们的研究没有使用单一散点图,因为它无法显示多变量数据。同样,由于两个原因,也没有使用完整的经典首先,这种可视化技术有助于对多变量数据进行概述而不是深入探索(Nguyenet al. ,2016 b)。其次,散点图矩阵技术会限制可以提出的问题类型,因为它在显示数据概览而不是细节方面的优势,这会降低条件之间的等效性。为了确保本研究中的公平比较,我们分别采用了单散点图和序贯散点图和同时散点图的散点图矩阵。序贯散点图技术连续显示相互关联的简单散点图,可能需要参与者从一个散点图到另一个散点图,以完成任务。的同时散点图是散点图矩阵的改编版本,其以网格形式显示所有散点图。我们采用可链接散点图(Nguyen et al. ,2016 b)来呈现多散点图,其中绘图面板和轴的数量以及视觉属性可以由用户定义。虽然多个散点图可以用另一种工具生成,如Tableau软件(tableau.com),但本研究选择了Linkable Scatterplots,因为它在数据交互方面具有更强的能力,可以在图之间进行映射、链接、刷涂和缩放。本研究探讨了可用性的任务的准确性和效率的背景下比较序贯散点图,多重散点图和同时散点图。我们还检查了用户为了确保一致性,使用相同的TabuVis工具(Nguyen et al. ,2013)。3.1. 参与者共有40名参与者,包括31名女性和9名男性完成了这项研究,其中包括20名一年级和20名四年级的心理学学生。新的一年级学生通常没有获得散点图和散点图矩阵技术和主要的统计方法的经验,而四年级的学生可能会在他们的课程学习这些技术。这样选择样本以形成两个组(新手和经验丰富的),并通过测试前经验检查表确认组组成。新手组由3名男性和17名女性组成,年龄范围为18经验组包括6名男性和14名女性,年龄范围为203.2. 设计本研究采用混合模型设计,包括两个组间因素(新手和经验者)和三个组内重复测量因素(序贯、同时和多重散点图)。这项研究测量了Q.V. Nguyen,N. 米勒,D。 Arness等人视觉信息学4(2020)14=-表1准确度和时间的描述性统计。技术组精度时间(秒)M SDMSD顺序新手0.70.1741.3615.32经历0.85.1331.697.89总0.76.1636.5212.98同时新手0.53.2349.2015.15经历0.60.2544.5718.32总0.57.2446.8916.76多新手0.72.2246.3615.79经历0.81.1536.148.89总0.77.1941.2513.67完成任务(效率)、任务的准确性(有效性)、对每种可视化技术的偏好以及用户体验。效率被测量为找到每种技术的所有问题的答案所花费的总时间,有效性被测量为每种技术的任务中正确答案的比例。组、技术和测量变量如表1所示。此外,任务后用户体验(UEX)调查问卷邀请参与者使用5分Likert量表提供关于其使用每种数据可视化技术的体验的反馈,并要求对每种数据可视化技术进行公开评论和偏好排名。记录新南方犯罪数据的多元数据集从www.example.com获得1995-2012年澳大利亚威尔士的数据data.gov.au初始数据集很大,几乎有10,000行,包含许多偶然变量(例如,年份>月份,犯罪类别>子类别)。考虑到这种复杂性以及样本中普遍缺乏数据分析方面的专业知识,采取的第一步是通过减少偶然变量类别的数量来压缩数据集,以便更有效地向参与者进行视觉表示。上述数据处理用Microsoft Excel完成。然后,通过从15年段(例如1995-2010年、1996-2011年、1997-2012年)内的较大数据集中系统地选择独特的年份组合,创建这些数据集中的每一个都被随机用于一个三种数据可视化技术。需要单独的数据集,以确保条件之间的等效性和最小化学习效应。然后使用相应的可视化技术表示每个数据集,并基于每个数据集制定五个问题任务在每个条件下的难度不等,并被设计为条件之间是等效的。每个任务有三个可能的多项选择答案选项。选择这种方法是为了确保散点图经验有限的参与者能够有信心为设定的任务提供答案进行了试点测试,以确保任务的明确性和时间安排。这导致了微小的词汇变化,例如将任务描述中的“相关”改为试点测试还导致对用于确保散点图可读性的颜色和形状的微小变化3.3. 激励措施和措施除了映射到轴之外,颜色和形状还用于在散点图面板上直观地显示变量向所有参与者强调了交互功能,如过滤、宽度控制功能和按需提供的详细信息,作为在多重散点图法实际上,在这种情况下,参与者可以获得一系列相关的散点图,并被要求完成一组五个任务,使用所描述的三个主要功能-过滤、宽度控制和按需细节。所有参与者在开始任务时都显示了数据集内的所有变量,然后可以与软件功能进行交互,以探索数据并回答测试问题。图图2和图3示出了在导航阶段的多散点图可视化的两个示例。这些图像绘制了选定年份内悉尼、坎特伯雷-班克斯敦、悉尼中西部、中央海岸、中北海岸、亨特、北恩海滩和里士满地区的所有犯罪类别。样本问题包括“哪种犯罪类别是最高的?”,其中一个更具挑战性的问题是“总体而言,1995年至2010年间内悉尼的犯罪率发生了什么变化?”图4显示了研究中序列散点图的可视化示例。这些图像描绘了所有犯罪类别2008年和2011年在东郊、圣乔治-伊拉瓦拉和中央海岸。与这组散点图有关的任务问题包括,例如,“1996年至2011年期间,哪种犯罪类别增加最多?”, 更难的问题是“1996年至2011年间,哪种犯罪类别最相似?”图5示出了同时散点图的可视化的示例,其涉及以网格形式显示的一系列四个相关散点图。任务问题的难度各不相同,有些要求参与者专注于网格中的一个散点图,而另一些则要求在散点图之间进行比较。例如,问题包括“圣乔治-伊拉瓦拉纵火和财产损失最高的年份是哪一年?”,一个更具挑战性的问题是3.4. 测试后调查问卷后测试问卷由四个项目组成,这些项目与使用不同散点图技术的用户体验方面有关,以5分制李克特量表(1 -强烈不同意,5-强烈同意和中立的中点)。问题包括“ 在在每组陈述的末尾还留出了空间,供参与者就他们使用每种技术的经验提供一般反馈和评论。最后,要求参与者按偏好顺序对每种散点图技术进行排名(1最喜欢,3最不喜欢)。3.5. 装置和材料所有参与者都在一台配备15.6英寸哑光屏幕显示器的HPProBook笔记本电脑上工作。本研究中使用的所有散点图均使用相同的TabuVis 工具(Nguyen et al. ,2013 年),但使用WindowsPhotoViewer将顺序散点图和同时散点图作为图像呈现给参与者。参与者被告知他们能够在序贯散点图条件下在散点图之间轻弹。多个-使用工具运行散点图并向参与者显示,以在多个面板上进行映射样本任务、条件任务和研究后问卷在单独的纸上提供给参与者,并为参与者提供一支笔来记录他们的答案。完成每项任务所需的时间由实验者用秒表测量并记录在单独的Q.V. Nguyen,N. 米勒,D。 Arness等人视觉信息学4(2020)15图二. 研究中使用的多个散点图示例,包含4个图组。用户可以选择映射轴和视觉属性,以适应他们的探索需要,例如颜色为统计分区变量,形状为类别变量。图三. 另一个可视化的例子是多个散点图,有3个图面板,其中轴被分配给不同的变量(例如年)。 这个例子使用了与图1中相同的数据集。二、可视化显示了不同的视觉映射颜色到类别变量和形状到统计分区变量。用户正在选择用于跨图进行比较的项目3.6. 程序受试者内设计意味着所有参与者完成相同的条件(序贯散点图、多重散点图和同时散点图)以及研究后问卷。所有试验均在安静的实验室中进行,以个体为基础,具有最小的干扰和受控的照明条件。当参与者完成任务时,实验者坐在参与者背对实验者,位于离笔记本电脑屏幕大约40 cm处,以限制来自实验者的任何分心或意外面部在第一次试验开始之前,所有参与者都完成了15分钟的培训阶段, 研究中的可视化技术训练阶段包括阅读标准化的训练指令和演示如何导航每种数据可视化技术。除了解释顺序散点图和同时散点图的静态控制技术外,实验者还演示了如何在交互式多重散点图技术中绘制数据向参与者展示了一个示例数据集,邀请他们探索数据并完成一组使用散点图技术的样本问题。在此阶段,鼓励参与者提出任何问题,以澄清他们对使用每种数据可视化技术的理解。一旦参与者觉得他们有信心使用每一种技术,测试阶段就开始了。在测试阶段,参与者被要求完成一组五个任务的三个散点图技术。研究人员向参与者解释说,他们最多有两分钟的时间来完成每项任务。他们被鼓励尽可能准确和快速地完成任务Q.V. Nguyen,N. 米勒,D。 Arness等人视觉信息学4(2020)16见图4。序 贯散点图实验中使用的一个散点图的示例。在实验中,这些散点图是分开呈现的,参与者可以在它们之间自由切换图五. 研究中使用的同时散点图示例。该图以有限的四个散点图显示所有七个变量(年)的值,而不是7× 7散点图矩阵这种可视化不为用户提供选择绘图数量、标测轴和视觉属性的灵活性Q.V. Nguyen,N. 米勒,D。 Arness等人视觉信息学4(2020)17×=±=-==-===-==-==-==---==-=====-==-−=== −=-=---==---让实验者知道他们什么时候开始阅读每项任务,这样计时器就可以启动了。当他们确信自己找到了答案,但在将答案记录在任务表上之前,他们被要求说实验者会记录完成任务所用的时间,并在参与者开始下一个问题之前重置计时器。在尝试了所有任务之后,参与者被邀请完成一份关于他们的经验和使用每种技术探索大型数据集的偏好的研究后问卷。3.7. 结果3.7.1. 业绩计量重复测量混合模型23多变量分析 进行方差分析(MANOVA)以确定在三种数据可视化技术条件下,初步数据筛选显示无缺失数据,样本量要求充足。非显著性Box's M,第14页,表明符合协方差齐性假设。球度的假设在准确度上令人满意地满足,但在时间上违反,因此Greenhouse-Geisser校正用于单变量检验。因变量之间存在低至中度相关性,没有多重共线性或奇异性的证据。虽然由于所有Mahalanobis距离评分均低于临界卡方(χ2)值22.46,df 6,p 0.001,因此未发现多变量离群值,但在时间变量中发现了两个单变量离群值,具有标准化残差 3.29.然而,实际花费的时间 这些参与者对任务的期望是合理的。3.7.2. 时间和精确度选择Pillai使用Pillai<组和技术之间没有显著的相互作用,F(4,35).74,p.571,ηρ2.08.在保留离群值的情况下进行初始MANOVA,然后重新运行离群 值 , 将 离 群 值 修 改 为 比 下 一 个 最 极 端 评 分 高 一 个 单 位(Tabachnick和Fidell,2013)。具有转换离群值的数据的Pillai.23;和Technique,F(6,33)106.16,p.001,ηρ20.95,组与技术之间无显著交互作用,F(6,33)1.06,p 0.41,ηρ2.16。结果等同,证实了保留离群值的决定。时间和准确度的描述性统计量见表1,目视检查见图1。6,表明有经验的用户在所有可视化技术中具有更高的准确性和效率,这证实了假设2(H2)。该图还支持假设1(H1),该假设表明同时散点图在准确度和时间方面的性能最差,而多重散点图和顺序散点图是相当可比的。作为显著MANOVA结果的后续,对准确度和时间进行了单独的单因素ANOVA,在经验水平和技术之间进行了合并,得到了4个单独的单因素ANOVA,调整后的α为0.0125。跨技术折叠,准确度F(1,38)7.74,p0.008,ηρ20.17但不及时接受任务,F(1,38)4.30 p0.045,ηρ20.10 倒塌在经验水平上,单因素方差分析显示,表2组间和总体偏好排序的描述性统计量新手经历整体MSDMSDMSD顺序2.25.722.55.512.4.63同时2.60.502.45.512.53.51多1.15.371.00.321.08.27注:1=最优选,3=最不优选。精确度,F(2,76)15.29,p 0.001,ηρ2<.29;和时间,F(1.55,58.80)15.71,p.001,ηρ2<0.29显著不同 在技术中。进一步探索这些影响,成对比较显示序贯散点图和同时散点图之间的准确性存在显著差异,MDiff .210,p<.001,百分之九十五CI[.104.316],和同时散点图和多重散点图,MDiff. 20,p. 001,95% CI [. 08,. 312],但序贯散点图和多重散点图之间的准确度无显著差异。<如表1所示,参与者 整体 是 少 准确 使用同时- 散点图优于顺序散点图和多重散点图。其他成对比较显示,序贯散点图和同步散点图之间的时间差异具有显著性(MDiff 10.89,p 0.001,95% CI [5.81,15.98];序贯散点图和多重散点图,MDiff<5.34,p 0.001,95% CI [1.94,8.74];但在同时散点图和多重散点图之间不存在。这表明参与者在使用顺序散点图完成任务时比其他人更快总的来说,这些结果表明,新手和有经验的参与者在使用顺序散点图和多重散点图技术的任务中最准确,但在使用顺序散点图(H1)的任务中最快。3.7.3. 偏好使用非参数检验来检查数据为有序且违反参数假设时的一致性排名差异进行Kruskal-Wallis非参数检验,以确定新手和有经验的参与者之间对三种散点图技术的偏好排序是否存在显著差异。序贯散点图排序结果显示各组间无显著性差异,χ2(1,N40)1.72,p.19,ηρ2.044;同时散点图χ2(1,N第四十章).88,p.35,ηρ2.02;和多重散点图χ2(1,N第四十章)3.16,p 0.08,ηρ2.08.这表明新手和有经验的参与者对每种技术的偏好排序相似。由于新手和有经验的用户对每种技术的偏好排序之间没有统计学显著差异,因此运行Friedman非参数检验以确定总体上三种技术之间的偏好排序是否显著不同。结果表明,不同性别的学生对不同技术的偏好差异有显著性,χ2(2,N第四十章)51.66,p.001,ηρ21.32.从表2和图3中可以看出,六,总体而言,多重散点图在所有参与者中排名最高(1个最受欢迎,3个最不受欢迎)。 评分表明,与序贯散点图和同时散点图技术相比,多重散点图技术是高度优选的,这证实了假设3(H3)。在序贯散点图和同时散点图之间,我们的研究还表明,有经验的用户对同时散点图的偏好略高,而新手用户对序贯散点图的偏好略高。Q.V. Nguyen,N. 米勒,D。 Arness等人视觉信息学4(2020)18======-==-见图6。 95%置信区间的性能结果:准确度(左)和完成时间(右)。3.7.4. 用户体验表3尽管可靠性分析的样本量较小(N40), 提出了采样系数α仍然可以如果主成分分析(PCA)的第一个因子加载很高,则在小样本量下对总体系数α进行稳健估计(Cui et al. ,2006年)。在进行之前,检查了与所有分析(ANOVA、PCA、内部一致性)相关的假设,并且通常令人满意。未发现缺失数据或单变量离群值。未发现多变量离群值,因为所有Mahalanobis距离评分均低于临界卡方(χ2)值32.91,df 12,p.001. Shapiro-Wilk检验表明,在序贯散点图和同时散点图用户体验中,新手和经验丰富的用户均符合正态性假设,但在多重散点图用户体验中不符合在多重散点图用户体验中可能会出现违反正态性的情况,因为直方图显示响应倾向于聚集在高范围内,可能表明使用该技术的用户体验更积极。主成分分析(PCA)与方差最大旋转进行检查的因素负荷的问卷项目的答复。KMO法的抽样准确度为0.70,Bartlett法<.001),确认数据的可因式分解性,并提供有信心继续前进。该分析的结果表明,PCA中的第一个因子在4.10处加载,这通常被认为是相当强的特征值,指示高度一致的响应(Packham等人,2009)。,2005)。根据Yurdugül(Yurdugül,2008),PCA的结果为运行计划的Cronbach α系数提供了信心,所有的Cron-bach重复测量方差分析结果显示组间无显著主效应,F(3,36).69,p.56,ηρ2.054.这表明所有用户在每种技术上都有类似的体验。然而,存在技术的主效应,F(2,78)36.42,p 0.001,ηρ2.48。<成对比较显示,多重散点图和序贯散点图之间的用户体验存在显著差异,MDiff 0.19,p 0.001,95% CI [0.77,1.62],多重散点图和同时散点图之间的用户体验存在显著差异,MDiff1.28,p 0.001,95% CI [0.89,1.67],但序贯散点图和同时散点图之间无显著差异。<<描述性统计量见表3和图2。7,表明参与者总体上倾向于强烈同意与多重散点图(H3)相关的用户体验项目,这表明与对照技术的基本中性体验相比,用户体验非常积极。与散点图技术相关的UEX响应的描述性统计量。技术M(标准差)95% CI序贯散点图UEX3.32(.92)[3.02,3.65]同时散点图UEX3.24(.85)[2.97,3.51]多重散点图UEX4.51(.67)[4.30,4.73]注:1=非常不同意,3=中立,5=非常同意。3.7.5. 不限成员名额的答复22名与会者在调查表的开放式反馈部分提出了意见。对收到的答复进行了分组整理(新手和有经验者),并采用简单的内容分析技术(顺序、同时、多重散点图),以确定主题,特别是用户体验的异同反映用户体验和偏好的指标,大多数受访者表示倾向于多重散点图技术。所有受访者均表示,他们欣赏多重散点图的交互性,这使得能够控制导航功能。更具体地说,19名受访者报告说,过滤功能使他们能够隐藏不相关的数据并专注于重要信息,这是完成任务的最有用的功能。过滤还有助于提高大部分答卷人对答案的信心。使用多重散点图对正确答案的信心增加在参与者完成研究时的非正式反馈中也很明显这与统计发现一致,即由于探索和学习处理,参与者花费更长的时间来完成多重散点图中的任务,而由于交互能力,他们更准确地完成任务多重散点图技术中映射和过滤的灵活性也反映了图中最高的用户偏好和用户体验。 六、关于同时散点图技术的反馈表明,许多受访者认为这种技术是有问题的。14名受访者报告说,在四个散点图中获得所有信息是压倒性的,看起来令人困惑,并报告说发现任务更耗时。然而,两组中的七名受访者报告说,他们发现这种技术更容易,因为他们能够很容易地比较散点图中的信息,这意味着他们不必在记忆中保存信息。这可能是由于参与者在处理多个视图时的视觉解释能力和工作记忆容量的不同水平反馈解释了图1A和1B中所示的该技术的统计上低的性能以及低的用户偏好和体验。分别为6和7。三 受访者 也 提到 的 顺序-散点图技术对记忆和注意力的要求更高,这使得任务更加困难。与会者还Q.V. Nguyen,N. 米勒,D。 Arness等人视觉信息学4(2020)19见图7。 用户偏好(左)和用户体验(右)以及95%置信区间。在使用序贯散点图和同时散点图技术时,经常对他们的答案不确定做出非正式的口头评论。这些评论与统计结果一致,即当使用序贯散点图时,参与者花费更少的时间来完成任务,并获得更低的准确度评分和用户偏好和体验。4. 讨论从概念上讲,作为一种交互式技术,多重散点图比顺序散点图和同时散点图具有一系列优势因此,预期多散点图将实现任务的优异性能,从而导致更高的准确性、更快的任务完成时间(效率)、更强的偏好和更积极的总体用户体验(H1在大多数情况下,这些期望在本研究中得到支持,除了任务完成时间。虽然与控制技术相比,使用多重散点图技术的准确性最高,但它并没有导致完成任务所需的更快时间正如预期的那样,有经验的参与者总体上比新手参与者更准确地使用所有散点图技术。然而,与受试者内的研究结果一致,但与预期相反,新手和有经验的参与者在完成任务所需的时间上没有显着差异。在本研究中,支持使用散点图的强大的一致性和积极的用户体验,突出了数据可视化技术在一系列用户使用大型和多变量数据时的巨大潜力。在 实践 提取 信息 使用 数据可视化技术可能涉及这当然可以解释本研究中发现的结果模式,其中更新的交互式技术多重散点图显示出高准确率,但更熟悉且可能更简单的序贯散点图技术显示出高准确性和高效率。对这些发现有两种可能的解释。首先,由于序列散点图固有的简单性,基于单个散点图,在这种情况下比其他情况下更直接。尽管有些参与者认为,跨越两个散点图进行观察是困难的,因为它对工作记忆提出了更多的要求,但这也使得不必要的信息被排除在视图之外,基本上是将重要信息分块,从而减少了解释的视觉拥挤。其次,作为一种新的交互式技术,参与者对多重散点图的熟悉程度要比其他两种技术低。因此,参与者可能不得不在精神上更加努力地记住功能,有助于数据探索过程,这可能使多重散点图技术在导航时更加耗时。考虑到在本研究中可能存在多重散点图的速度-准确性权衡,完成任务所需的较慢时间并不一定会降低整体可用性。使用多重散点图格式的进一步训练可以潜在地使该技术的使用更有效。Freedman和Shah在这种程度上,预期有经验的参与者将比新手参与者更准确本研究支持这一主张,结果表明,有经验的用户在所有技术中都更准确,并且比新手用户更快地完成任务。把解释散点图的简单经验可能有助于更准确地解释散点图,但因为多重散点图技术是陌生的,新手和有经验的参与者都需要更多的时间来完成任务使用这种技术。展示了偏好排名和用户体验结果与对照技术相比,参与者具有更强的偏好和更积极的用户体验,这与预期一致。 这些措施提供了关于如何以及为什么性能指标发生的有价值的见解,并给出了技术的感知价值的强有力的指示,这不会出现单独使用性能指标(Huanget al. ,2008年)。尽管多重散点图并没有带来最佳的时间性能,但这种技术确实带来了更高的准确性。通过调查问卷数据获得的反馈强调,准确性的提高在很大程度上得益于多重散点图的过滤功能。正如预期的那样,过滤使用户能够从视图中删除不必要的信息,以便专注于与任务相关的数据方面,大多数参与者重视探索数据和完成任务。通过参与者在完成任务时的非正式反馈也观察到,多重散点图有助于提高响应准确性的信心,过滤功能。虽然这在这项工作中没有直接测量,但在未来的研究中,在比较技术时包括置信度测量可能是有益的。调查问卷中获得的定性信息也很高-每种技术的关键问题。例如,一些参与者指出,在序贯散点图条件下,从一个散点图切换到另一个散点图需要更多的时间。Q.V. Nguyen,N. 米勒,D。 Arness等人视觉信息学4(2020)110记忆力和注意力,使任务变得更加困难。类似地,同时散点图技术被注意到在视觉上被绘制的大量数据拥挤,使得该技术在提取关于特定数据点的信息时令人困惑,但是对于在散点图之间进行比较是有用的。这进一步证明了对智能数据可视化界面的需求,这些界面可以利用感知优势并补偿认知限制,以帮助有效和高效的数据探索和发现。性能因素和主观因素通常被认为是数据可视化可用性的有用度量(Zhu,2007)。 在本研究中,通过检查性能因素来测量可用性,包括多重散点图技术可以在多大程度上促进数据的简单、有效、准确和有意义的解释(Few,2013),以及该技术如何有效地提供积极和满意的用户体验(Huang et al. ,2008年)。在这个意义上,本案例研究提供了初步的经验支持的交互式多重散点图的可用性。本研究的结果表明,该技术具有显着的潜力,作为一个用户友好的方式,可以促进有效的数据发现和探索多维数据。5. 结论多重散点图技术假设提供比单个散点图更多的图用于比较,同时它还减少了散点图矩阵的不必要的图面板数量。该技术还提供了丰富的交互,分析人员可以定制可视化,以满足他们的期望和分析要求。本文介绍了用于多维数据探索性分析的序贯散点图、多重散点图和同时散点图方法的可用性研究。对照研究结果表明,多重散点图和序贯散点图比同时散点图更准确,但序贯散点图、多重散点图和同时散点图的完成时间增加。多重散点图作为一种用户友好的技术获得了巨大的潜力,可以促进多维数据的有效深度探索,其中完成时间在分析过程中可能不是至关重要的。CRediT作者贡献声明阮光荣:软件,监督,写作-原始草案。娜塔莉·米勒:形式分析,调查,写作-原始草案。大卫·阿尼斯:监督,验证,写作-重新审视编辑. 黄卫东:方法论,写作-评论编辑. 黄茂林:概念化,写作-评论编辑. Simeon Simoff:概念化,监督。竞合利益作者声明,他们没有已知的竞争性财务利益或个人关系,可能会影响本文报告的工作引用阿尔伯克基,G.,Mr. J.莱曼,D.J.,Theisel,H.,Magnorm,M.,2009. 基于质量的可视化矩阵在:在视觉,建模和可视化(VM
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 前端协作项目:发布猜图游戏功能与待修复事项
- Spring框架REST服务开发实践指南
- ALU课设实现基础与高级运算功能
- 深入了解STK:C++音频信号处理综合工具套件
- 华中科技大学电信学院软件无线电实验资料汇总
- CGSN数据解析与集成验证工具集:Python和Shell脚本
- Java实现的远程视频会议系统开发教程
- Change-OEM: 用Java修改Windows OEM信息与Logo
- cmnd:文本到远程API的桥接平台开发
- 解决BIOS刷写错误28:PRR.exe的应用与效果
- 深度学习对抗攻击库:adversarial_robustness_toolbox 1.10.0
- Win7系统CP2102驱动下载与安装指南
- 深入理解Java中的函数式编程技巧
- GY-906 MLX90614ESF传感器模块温度采集应用资料
- Adversarial Robustness Toolbox 1.15.1 工具包安装教程
- GNU Radio的供应商中立SDR开发包:gr-sdr介绍
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功