平行坐标绘图识字教学软件对PCP素养提升的影响

72 浏览量更新于2024-01-24 收藏 3.26MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

视觉信息学6（2022）81P-Lite：平行坐标绘图识字的研究埃利夫·E放大图片作者：J.Wilsona，Robert S.拉腊米aa英国诺丁汉大学计算机科学学院b英国约克大学计算机科学系art i cl ei nfo文章历史记录：2022年3月10日收到收到修订版，2022年5月10日接受，2022年2022年6月2日在线发布保留字：以人为中心的计算可视化系统和工具可视化a b st r a ct可视化素养，解释和理解视觉设计的能力，被可视化社区认为是一项基本技能。我们确定和调查的障碍，理解平行坐标图（PCP），一个先进的图形表示多元和高维数据的显示。我们开发了一个平行坐标识字测试与不同的图像生成使用流行的PCP软件工具。该测试提高了对PCP的认识，用户的读写能力。我们介绍了一个互动的教育工具，协助教学和学习的平行坐标提供了一个更积极的学习经验。使用这个教学工具，我们的目标是提高新手用户的平行坐标识字技能。基于这一假设，即一个互动的工具，将传统的笛卡尔坐标与PCP互动将提高PCP素养进一步比静态幻灯片，我们比较了使用传统的幻灯片与我们的新的软件工具的学习经验，并调查了教育软件的效率与在线，众包的用户研究。用户研究结果表明，我们的教学工具，积极影响用户的PCP的版权所有©2022作者。由爱思唯尔公司出版我代表浙江大学和浙江大学出版社有限公司这是一个在CC BY-NC-ND许可证下的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。1. 介绍由于数据量的不断增加，数据可视化的解释和理解变得越来越重要使用可视化设计对大型复杂数据进行探索性分析用户解释可视化的能力可能会有所不同，这取决于视觉表示如何呈现数据（普通或嵌入）（Bateman et al. ，2010）和他们自己的背景和经验（Peck et al. ，2019）。可视化素养在可视化社区中得到了广泛的研究（Boy et al. ，2014; Alper等人，2017; Firat et al. ，2020年）。在IEEE VIS'19会议的主题演讲中两个研讨会，一个在EuroVis '14''To- wards Visualization Literacy''（Romero et al. ，2014 年），以及另一个在 IEEE VIS '14' Towards an OpenVisualization Literacy Testing Platform ''（Kim et al. ，2014年）表明，可视化素养在可视化社区中越来越受欢迎。可视化素养被定义为*通讯作者。电子邮件地址：elif. nottingham.ac.uk（英文）Firat）。https://doi.org/10.1016/j.visinf.2022.05.002域”（Boy et al. ，2014）;“从数据的视觉表示中理解和解释模式，趋势和相关性的能力”（Börner et al. ，2016）;“阅读和解释数据可视化中的可视化表示数据并从数据可视化中提取信息的能力和技能”（Lee et al. ，2017年）。平行坐标图（PCP）通过使用平行轴提供多维关系的图形表示（见图1和图2）。1和2号文件）。这种设计在实践中可以显示高达10-15维的高维数据，因为每个轴在视觉上是分开的（Kosara等人，2005）。，2006年）。每条折线代表一个数据记录，它与平行轴相交于指定点，这些点表示各个尺寸的值。例如，与笛卡尔坐标图（CCP）相比，PCP在平面中显示多维数据，提供了额外的优势（见图2）。在CCP和PCP空间中绘制数据的过程在本文中，我们将PCP素养定义为正确阅读，解释和构建PCP的能力PCP素养对于任何有兴趣理解多维数据的用户来说都是必不可少的，因为这是PCP与其他更常见的可视化设计的区别然而，PCP有一个难以理解的名声，称为专家专用的视觉设计，特别是如果实现缺乏必要的功能，例如交互（Siirtola和Räihä，2006）。我们介绍了一种新的识字测试，以评估和提高PCP识字。在测试中，我们包括使用流行的现成PCP工具生成的数据集和图像。根据我们的经验，2468- 502 X/©2022作者。由爱思唯尔公司出版代表浙江大学和浙江大学出版社。公司这是一个在CC BY-NC-ND许可证下的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。可在ScienceDirect上获得目录列表视觉信息学期刊主页：www.elsevier.com/locate/visinfE.E. Firat，A. Denisova，M.L. Wilson等人视觉信息学6（2022）8182图1.一、具有 7 个属性的汽车数据集的示例平行坐标图。该图像是使用Xmdv创建的（Ward，2021）。图二、使用二维点数据的笛卡尔坐标图和平行坐标图的示例。通过在课堂上教授PCP，我们开发了一种互动的儿科工具，通过使新手增强他们对PCP的理解、解释和构建来提高PCP的读写技能除了支持用户的识字技能外，该工具还包括：表1下表总结了我们PCP读写能力测试的补充材料（带有URL）。补充材料URL有效地将数据转化为知识，并可用于支持课堂上的主动学习体验。我们的基本假设是，教育 PCP软件（菲拉特还有拉拉米（2020年d）实验说明（Firat和Laramee，2020 c）https://bit.ly/3ddTMJlhttps://bit.ly/36UobZH将CCP和PCP互动地联系起来，将进一步提高PCP的普及率而不是静态幻灯片。我们使用传统的幻灯片与我们的新型软件工具来评估学习体验，并通过在线众包用户研究来调查PCP扫盲教育软件的效率本文的主要贡献是：1. 关于五氯苯酚扫盲障碍的讨论（见第3节）;2. 开发一种新的教育工具，促进平行坐标的教学和学习，促进平行坐标扫盲（Firat和Laramee，2020 d）（见第5节）;3. 开发一种新的五氯苯酚识字测试（Firat和Laramee，2020年b），并进行用户研究，以评估幻灯片视频演示（Firat和Laramee，2020年e版）https://bit.ly/36MSRvU软件视频演示（Firat和Laramee，2020年a版）https://bit.ly/3ix3ZSZPCP识字测试（Firat和Laramee，2020年b版）https://bit.ly/3xOUEMr我们的教学软件对平行坐标的理解（见第4和第6节）。表1概述了本项目扫盲研究的补充材料。补充材料使研究完全可重复。本文的其余部分组织如下：第2节介绍了相关的工作，包括视觉化素养和PCP的相关文献与用户研究评估。第3节E.E. Firat，A. Denisova，M.L. Wilson等人视觉信息学6（2022）8183确定并提出了一些解释平行坐标的挑战。第4节介绍了平行坐标识字测试的开发，第5节介绍了教育识字工具。第6节解释了如何进行用户研究，第7节分析了结果。讨论在第8节中介绍。最后，在第9节中给出了结论。2. 相关工作以前有几个关于视觉化素养的项目，研究视觉设计对用户对视觉界面的理解和高级理解的影响一些研究通过提供用户研究结果的评论来调查用户的可视化素养技能。我们搜索了关于信息可视化的调查（SoS）（McNabb和Laramee，2017），关于交互式可视化素养的调查（Firat等人，2017）。，2022 a），Firat et al.（2022b）和交互式可视化教育（Firat和Laramee，2018），以及信息可视化书籍的研究（Rees和Laramee，2019），用于可视化素养的相关文献。在本节中，我们将介绍一系列可视化素养研究和平行坐标论文，其中包括使用PCP的用户研究。虽然可视化素养论文侧重于调查和提高新手用户表2总结了先前研究与本文所述工作之间的差异。2.1. 可视化素养Börner et al.（2016）调查了博物馆参观者对各种视觉设计的普遍熟悉程度。选择了大约20个教科书可视化和常用的在线可视化库，如D3.js（d3，2020在这些可视化模型中有两个图表、五个地图、八个图形和五个网络布局。科学馆向参观者展示了20幅图片中的5幅。博物馆的参观者被要求陈述他们对模型的熟悉程度，并确定设计名称。更多地关注儿童，Alper et al. （2017）探索小学生的视觉化素养技术，并开发一个名为C'est la Vis的互联网平台，使用户能够生成视觉设计并与之互动。它被课堂教师用于通过为儿童开发练习来教授可视化，例如阅读，完成和创建可视化。我们也关注向学习者传达可视化，但更多地关注特定类型的可视化（PCP），而不是向年轻人传授。Ruchikachorn和Mueller（2015）的研究引入了一种类比学习技术，该技术显示了两个视觉模型之间的逐步转换，以解释一种不熟悉的可视化方法。使用四个可视化对的例子来说明这个概念，例如数据表和平行坐标，散点图矩阵和hyperbox，线性图和螺旋图，以及分层饼图和树图。在与过渡交互之后，用户可以更快地理解新的视觉模型。同样，我们工作的主要重点是通过交互动画显示CCP和PCP之间的对应关系我们还开发了一个特殊用途的PCP识字测试，结合开发的教学工具。Boy等人提供的一项研究的目的是（2014）是创建一个可视化素养评估技术。他们使用项目反应理论（IRT）（Reckase，2009）来评估可视化素养测试项目与考生们。主要目的是生产快速，有效，可靠的测试，研究人员可以用来识别较低的视觉素养技能的考生。该研究解释了两个线形图可视化素养测试的设计和评估，并提供了条形图方法的扩展和散点图相比之下，我们的研究提出了一个测试，重点是发展PCP素养。我们调查了参与者的PCP识字技能，以及他们在回答与多维数据相关的问题时最挣扎的是什么。Lee等人（2017）开发一个测试来评估非数据可视化专家的用户的可视化素养技能。这项名为VLAT的测试由12个视觉设计和53个测试项目组成，包括8个主要任务。初步研究验证了测试材料及其可靠性。他们还研究了用户的VLAT结果与他们理解不熟悉的可视化的能力之间的联系。从概念上讲，我们的工作扩展了Lee等人的工作，增加了更高级的视觉设计，即PCP。Firat et al.的研究（2020）确定了树图识字的障碍，以提高非专家用户在树图识字方面的技能。两年的信息可视化作业的结果被用来识别理解和构建树图的障碍和挑战。开发了一个树形图读写测试来评估用户对树形图的理解和解释能力。本研究提出一个教学树图工具，以促进教学和理解的树图和进步的树图设计。此外，还进行了一项有25名参与者的课堂研究，以评估教育工具的有效性。本研究中对可视化素养障碍的调查、评估测试和教育工具与我们的研究有相似之处，但重点是五氯苯酚扫盲。在一般情况下，我们在这里介绍的工作不同于以往的可视化素养的工作，包括多维和高维的视觉设计的评价。以前的工作集中在低维图像，如表2所示。2.2. 用户研究与平行坐标Inselberg写了大量关于平行坐标的文章，并提供了一个深入的指南（Inselberg，2009）。我们发现了三篇使用SoS的调查论文（McNabb和Laramee，2017），这些论文集中在平行坐标上。Dasgupta等人的一项调查。（2012）试图识别屏幕空间中的各种不确定性来源，并将其与对用户的不同不确定性影响联系起来。他们回顾了对平行坐标的研究，并使用税收分类法对不同的技术进行分类，以减少歧义（Das-gupta et al. ，2012）。Heinrich和Weiskopf提供的另一项调查调查了平行坐标文献并进行了分类，旨在引导研究进入新的主题相关方向（Heinrich和Weiskopf，2013）。Johansson和Forsell提出了一个详细的文献综述，重点是以用户为中心的评估和分析平行坐标的可用性目标是了解人们如何使用PCP来识别PCP扫盲的障碍，并为未来的研究提供一套指导方针（Johansson和Forsell，2015年）。Yang等人（2003）提出了一种交互式分层显示（IHD）系统，以解决大型数据集研究中与分层多变量可视化（HPC）技术相关的混乱挑战。对于IHD的评价，要求20名用户使用两种不同形式的平行坐标图识别模式：平面平行坐标（FPC）和HPC。模式被广泛地描述为集群或离群值。Partic-ipants发现了25种模式中的8-9种。使用HPC的受试者比使用FPC的受试者更成功地发现大型数据集的趋势。这项工作评估了建议的内部健康发展框架是否为用户提供了有效的帮助，\表2可视化素养和PCP与用户研究的相关文献综述。这些栏目是：用户研究主题，视觉设计测试，图像生成工具和方法，评估技术，提供了用于评估的工具、用户研究中包括的参与者人数以及提出的任务（T）或问题（Q）的数量。每个研究论文使用的评估技术是分类的分为：受控用户学习、课堂设置和众包。用于视觉设计的缩写包括BC：条形图，CM：脉络膜体积图，H：直方图，LC：折线图，PC：饼图，RM可重排矩阵，PCP：平行坐标，P：象形图，S：螺旋图，SC：堆栈图，SP：散点图，T：树图，IHD：交互式分层显示。（C）表示本文介绍了一种定制的图像生成工具研究论文用户学习主题视觉设计图像生成评价方法评价工具Partici-裤任务问题Boy等人（2014年）视觉化读写能力测验BC，LC，SP手动众包Amazon MTurk（AMT，2020）43 48T05The Dog（2015）测试将不熟悉的可视化与熟悉的可视化LC、PC、S、SP、PCP、T处理（Reas和Fry，2003）众包亚马逊MTurk（AMT，2020年）22 12QBörner等人（2016年）Alper等人（2017年）确定用户对不同视觉设计测试用户BC，PC手册现场表格273 100Q BC，PLee等人（2017年）内容效度和测验信度BC、CM、H、LN、PC、SC、SP、T手动众包Amazon MTurk（AMT，2020）小行星297 53 QFirat等人（2020年）树图测试和教育树图工具《树之书》（The Book of Trees，利马，2014年）学生教室台式计算机25 57Q03The Dog（2003）RM和PCPRM，PCPYang等人（2003年）SiirtolaandRäihä（2006）Lind et al.（二零零九年）Claessen和Van Wijk（2011）对IHD框架的评估PCP与SQL新PCP轴布局评估新PCP原型可用性评估SC，SG，SP，PCP IHD Framework（C）受控用户学习台式机20 1T PCP PCP Explorer（C）受控用户学习台式机16 16Q PCP多对多布局（C）受控用户学习台式机12 21Q PCP FlinaView（C）受控用户学习台式机10 7QRosenbaum等人（2012年）测试新样式在模式检测中PCP Progressive PCP（C）众包Amazon MTurk（AMT，2020年）43 20 QPalmas等人（2014年）新PCP与传统PCPPCP边缘捆绑布局（C）众包大学邮箱137 2TKanjanabose等人（2015年）SP和PCP的比较PCP，SP手动控制用户研究台式计算机42 4TKwon和Lee（2016）调查在线学习环境PCP手册众包Amazon MTurk（AMT，2020）120 18Q我们的工作PCP扫盲障碍和测试开发PCP高D（Brodbeck和Girardin，2021 b），Mondrian（Theus，2021），Quadrigam（Quadrigam，2021），PCP工具，Xmdv（Ward，2021），XDat（DeRochefort，2021）众包亚马逊MTurk（AMT，2020），Qualtrics（Smith etal. ，2020年）60 28QE.E. Firat，A. Denisova，M.L. Wilson等人视觉信息学6（2022）81PCP用户研究84视觉化素养E.E. Firat，A. Denisova，M.L. Wilson等人视觉信息学6（2022）8185≥≥大型数据集。他们的研究假设参与者已经对PCP有了基本的了解，而我们的研究则没有。Siirtola（2003）比较了两种功能不同的视觉设计：PCP和可重排矩阵（RM），并研究了如何将这两种视觉设计结合起来。进行了一项实验，其中20名参与者使用具有相同数据的RM和PCP视图的应用程序执行任务，有和没有链接。结果表明，虽然视图连接最初减慢了用户任务的性能，但它加速了学习，并受到用户的欢迎。同样，我们的研究表明CCP和PCP之间的联系，而不是RM和PCP。Siirtola和Räihä（2006年）讨论了PCP浏览器中的交互方法，并根据先前的用户界面指南对其进行了审查。实证研究中进行的PCP的可用性进行了测试。它们表明了平行坐标的丰富的交互机会，并说明了交互性的方法的价值。我们还结合了一个互动来显示CCP和PCP设计之间的对应关系，以促进用户的理解。林德等人（2009）为多个PCP显示器提供了新的轴布局，以帮助用户。多对多关系平行坐标的显示旨在增强变量之间关系的视觉我们的工作不同，提出了一个标准的PCP布局，而不是一个新的，增强的设计。Claessen和Van Wijk（2011）的目标是允许用户自由地识别和定位灵活的链接坐标轴，并通过将这些轴与灵活的布局链接来指定新颖的视觉布局。这使用户能够比较散点图、PCP和雷达图，并创建高度自定义的布局。该方法进行了测试，10个用户谁认为这个想法很容易掌握，非常令人鼓舞。这项工作提出了新的PCP功能例如，轴布局，可以潜在地为我们的研究提供未来的工作。他们的研究假设参与者已经对PCP有了基本的了解，而我们的研究则没有。Rosenbaum等人（2012年）实施积极的PCP，以克服由于处理大量数据而带来的数据收集和设计挑战。对43名参与者进行了一项系统研究，以比较渐进式PCP与常规PCP的有效性。参与者被要求进行各种练习，例如识别实例中的模式，并在改进的各个阶段中寻找相似之处研究结果表明，这两种方法在准确性方面没有重大差异然而，渐进式PCP的模式检测速度略快，平均只需37%的数据就可以识别模式。他们的研究要求参与者从基本的PCP识字水平开始，而我们的研究则没有。Palmas等人（2014）介绍了一种边缘捆绑技术，对每个维度使用基于密度的聚类。它允许使用多边形渲染聚集的线，从而显著减少渲染时间。他们还使用这种技术开发属性一个网络调查问卷，两个任务，比较经典的PCP对新的视觉设计在用户研究。问卷的链接被发送给当地一所大学的计算机科学专业的学生和研究人员，共有137名受访者分析了他们的用户研究假设在参与之前有基本的PCP知识，而我们没有。Kanjanabose等人（2015）进行了一项实验，包括42名参与者，比较散点图（SP）和PCP，并使用四个特定任务在准确性和响应时间方面测量用户性能。任务难度分为三个层次，分别以数据表、SP和PCP表示。同样，我们显示了CCP和PCP之间的联系，并衡量参与者Kwon和Lee（2016）通过研究主动学习理论的影响，专注于平行坐标，研究多媒体学习环境对非专家用户教学数据可视化的影响。为了研究数据可视化教学的有效性，对120名参与者进行了一项基于数据点与视觉元素映射、数据分布、比较和相似性等任务的18个问题的实验。本研究以平行坐标为研究对象，借由主动学习理论的影响，探讨多媒体学习环境对非专业使用者教学资料可视化的影响。为了研究数据可视化教学的有效性，对120名参与者进行了一项基于数据点与视觉元素映射、数据分布、比较和相似性等任务的18个问题的实验。在这项研究中，视频教程和静态教程的方法是类似于我们的，但该研究不包括观看相关的标准方法（CCP），以加速学习，识别障碍的理解一个PCP，并开发一个识字评估测试。识字研究和研究在volving用户研究之间的区别是，在一般情况下，用户研究的PCP假设的视觉设计的基本先验知识，而识字研究假设没有先验知识。这是因为用户研究通常侧重于标准布局上的特定PCP设计优化。我们的工作不需要任何先验知识，并开发了一个促进扫盲的教程。表2总结了我们的工作与以前相关工作的比较。这项研究第一个专注于PCP的同类产品。与以前的工作不同，它比较和链接CCP与PCP。我们还比较了PCP的视觉设计与最流行的视觉设计，以告知和识别PCP扫盲的具体障碍。我们设计了一种新颖的教学工具，并进行了一项众包用户研究，以收集证据和研究PCP扫盲的障碍。我们的研究重点是专门对PCP扫盲，因为我们提供分析和指导，以解决阅读，理解和解释PCP的障碍。总之，我们的工作是障碍识别、PCP工具评估、PCP素养测试开发和PCP素养用户研究的独特组合。3. 解释PCPPCP为研究多维高维数据的性质提供了一种可视化的解决方案与遵循连续垂直和水平绘图过程的笛卡尔坐标图（CCP）相比，PCP在沿轴定位点时侧重于连续垂直尺寸我们确定了至少七个障碍， PCP 扫盲的基础上，既审查了调查文件对这一主题（ Dasgupta 等人。， 2012;HeinrichandWeiskopf ，2013;Johansson and Forsell，2015），我们在课堂上用传统幻灯片教授PCP的经验（超过10年），然后评估课程。我们确定了以下障碍：（S）与CCP和其他流行的设计相比，空间PCP使用另一种空间布局。最流行的视觉设计是基于两个正交轴，而PCP是基于重复的（通常2-10）平行轴（Lee et al. ，2017年）。不熟悉轴的这种用法可能会在解释PCP时造成障碍（M）多元平行坐标计算的一个障碍是需要理解多元（n 3）或高维（n 5 ）数据属性及其关系（Ward et al. ，2010年）。··E.E. Firat，A. Denisova，M.L. Wilson等人视觉信息学6（2022）8186≥图三. （a）Lee等人调查的数据可视化类型。（2017）来自三个来源：K-12课程，数据可视化创作工具和流行的新闻媒体。（b）第（1）款组成VLAT的12个最受欢迎的视觉设计图片来自Lee et al. （2017年）。(C) 相关性识别数据维度之间的相关性和关系，以及了解如何解释边缘的斜率，是平行坐标解释的障碍之一。轴之间的边缘的斜率这一障碍还要求在项目合作伙伴关系的范围之外单独理解统计术语，即相关性，这使其更加复杂。(D) 分布解释的障碍之一是基于边缘在屏幕空间上的分布。边的分布越不均匀，在多段线相互交叉和阻碍时，跟踪多段线就越困难。过度绘制可能导致更高的视觉复杂性和遮挡（Heinrich和Weiskopf，2013）。(O) 顺序平行坐标依赖于指定轴在屏幕空间中放置的轴布局顺序。轴的位置可能会对理解PCP中不是相邻邻居的数据维度之间的关系造成障碍（Heinrich和Weiskopf，2013）。(P) 路径跟踪路径（或路径跟踪）跟踪是PCP中的一项新任务，在CCP中不需要。（E）PCP中的边缘与点边缘对应于CCP中的点。这种转换可能会导致认知挑战。我们还确定了两个一般的可视化障碍方面的标签和传说。然而，我们选择不进一步调查这些一般问题，因为缺乏标签和图例意味着PCP设计是不完整的。例如，很难识别没有标签的数据轴。虽然我们没有进一步调查，但供参考的是：标签轴上的标签和最小-最大值便于用户理解。缺少轴标签可能会妨碍对PCP的了解。图例在PCP中使用颜色映射时，颜色图例表示数据属性的值范围。缺少颜色图例可能会妨碍对PCP的理解。Lee等人（2017）调查了教育课程中最受欢迎的12种视觉设计，以及新闻文章中最常用的视觉设计从他们的Fig. 3，我们观察到平行坐标不是最流行的图形表示之一，因为PCP是一种难以理解的视觉设计。考虑到已识别的障碍，PCP具有许多特征，这些特征将其与Lee等人描述的其他最常见的视觉设计区分开来：它使用独特的空间和轴排列来沿着代表数据变量的垂直轴绘制点。如果我们看图。3小心，所有其他设计使用笛卡尔坐标空间，除了饼图和树图。轴通常是正交的，而在PCP中，它们是平行的，通常有几个（空间）平行坐标设计用于显示多元数据。图 3只包含一个多变量可视化（堆叠条形图）。我们认为这是理解PCP的障碍之一。（多变量）PCP是唯一的设计，重点是确定多个（n3）属性之间的直接关系。（相关性）PCP使用与平行轴交叉的多线来呈现大量的数据记录（分发）PCP是唯一一个需要决定变量顺序而不是树形图的视觉设计。（订单）每个数据变量与特定类别相关联，该特定类别可以具有不同类型的属性。（标签）要保证这些都是解释PCP的障碍是不可行的。可能还有其他障碍，调查进一步的障碍是未来工作的一个很好的候选人。4. 制定五氯苯酚识字测试我们建议进行PCP识字测试，以评估个人为了开发一个有效的识字测试，我们调查了相关的工作和平行坐标工具，适当的软件和相关数据，同时考虑到各种软件的功能。我们的主要假设是，与静态幻灯片相比，使用交互式工具演示的学生在读写测试中表现更好。我们通过探索在线提供的PCP工具和数据集，开始为识字测试创建适当的PCP然后，我们使用这些数据集和工具来创建高质量的PCP图像。在这个阶段之后，我们选择最高质量的图像，包括在我们的识字测试。在选择PCP图像后，我们为每个PCP图像开发具有多项选择答案的然后，我们编制了28个PCP识字测试问题，以评估和比较使用者在4.1. 识别PCP工具我们回顾了使用Yalçın等人（2017），Kirk（2020）和Liu等人提供的在线软件集合创建PCP的可视化工具。（二零二一年）（见表三）。此外，我们还搜索了最常用的可视化工具来生成使用谷歌的PCP。我们还检查了学生·············E.E. Firat，A. Denisova，M.L. Wilson等人视觉信息学6（2022）81表8787用于为识字测试创建PCP图像的工具。该表显示了工具的名称和支持的一些重要功能，如颜色映射多段线，可自定义的颜色映射，可自定义的颜色选择，可自定义的背景颜色，轴标签，可自定义的轴标签，绿色单元格表示支持相应的功能。的各种工具和颜色映射折线可定制颜色贴图C. 折线颜色选择C. 背景颜色轴标签C. 轴标签Min-Max值C. Min-Max值读文本数据可移除轴Gogobi（Cook和Swayne，2021）高D （Brodbeck 还有吉拉尔丹2021 b）蒙德里安（Theus，2021）Quadrigam（Quadrigam，2021）条子（Doerfler，2021）PowerBI（Powerbi，2021）Spotfire（Tibco，2021）SPSS（IBM，2021）XDat（DeRochefort，2021）Xmdv（沃德，2021）见图4。从2018年和2019年计算机科学学生的信息可视化作业中选择平行坐标工具我们在斯旺西大学教授的课程学生创建了平行坐标示例，并描述了使用的工具或技术以及用于创建图像的数据集（见图1）。4）.我们结合教学经验，以告知和识别PCP扫盲的障碍。在评估这些作业的10多年里，我们反复看到一些相同的错误我们根据渲染质量、颜色的使用、轴标签的存在和易读性以及清晰标记的轴刻度，系统地评估和比较了每种工具。通过渲染质量，我们的意思是渲染没有太多的线锯齿。我们没有一个特定的颜色，我们认为这是必需的，但一般较暗的颜色在一个良好的对比度水平的光背景。我们也在寻找高质量的色彩映射。此外，轴标签是必要的，以解释每个轴是什么特定的实验。在测试后─通过对各种来源的PCP工具进行分析，我们确定了一系列工具来为识字测试创建高质量的PCP，如下所示：Ggobi（Cook和Swayne，2021）、High-D（Brodbeck和Gi-rardin，2021 b）、Mondrian（Theus，2021）、Quadrigam（Quadrigam，2021）、MicrosoftPowerBI（Powerbi，2021）、Sliver（Doerfler，2021）、Spotfire（Tibco，2021 ）、 IBMSPSS Statistics （ IBM ， 2021 ）、 XDat （ De-Rochefort，2021）和Xmdv（Ward，2021）。这些工具提供了高质量的平行坐标图，具有清晰的设计，着色和标签选项（见表3和图4）。 5）。表3显示了测试过的PCP工具的重要特征颜色映射折线列标识将颜色映射应用于一组折线的能力，而可自定义颜色映射列指示更改颜色映射的选项。可自定义的颜色对于更改颜色很重要单独选定的多段线。可自定义背景指示更新背景颜色的选项。轴标签是指每个轴顶部或底部的可见标签，某些工具可通过软件方便地修改轴标签（可自定义轴标签）。此功能对于为最终用户创建清晰的PCP图像至关重要我们使用可定制的颜色来创建具有特殊颜色的多段线图像，这些颜色可以在显示器上跟踪，因此可以在多个维度上跟踪。我们修改了一些轴的标签，使其更清晰。例如，如果轴标签太长或太小，我们会缩短标签或增加字体大小。最小值-最大值表示软件显示最小值和最大值属性值，可自定义的最小值-最大值表示用户可以使用软件更改这些值。由于改变最小值-最大值，轴应重新缩放。我们修改了一些最小-最大值，以简化一些PCP图像，包括删除一些不必要的小数位。有些工具只能读取数值。这很重要，因为有些数据集以文本数据为特征。可以读取文本数据的工具在“读取文本数据”列下指示。移除轴特征可以使得一些轴在图像上可见或不可见。我们结合了这个功能来降低一些数据集的维度，从而简化了一些图像，例如，保持维数≤10。4.2. 探索数据集为识字测试创建适当的PCP对于评估用户的识字水平很重要。因此，我们通过我们选择用于创建PCP图像的工具网站（例如Xmdv数据集（Ward，2020））仔细寻找适当且可解释的多变量数据集。为了选择合适的数据集进行识字测试，我们使用以下标准对其进行约束：• 多维包括4个或更多个维度，• 最小为5条记录，最大为10，000条，• 研究一个不太常见的主题或行为，• 明确记录的数据维度。数据集搜索旨在创建足够多的图像，并使具有各种读写技能水平的考生能够尝试一系列问题。我们在表4中发现了10个数据集。我们注意到以前的许多相关论文只测试了一两个数据集。我们想要比以前的许多相关工作更广泛的多样性。我们还创建了具有聚类、相关性、模式和异常值的图像。轴通常按与原始数据相同的顺序排序。4.3. PCP图像生成过程我们一起使用这些数据集和工具为识字测试题创建高质量的PCP图像。我们使用每个工具导入数据集，删除一些冗余的尺寸，更新一些折线和背景颜色以获得更高的质量E.E. Firat，A. Denisova，M.L. Wilson等人视觉信息学6（2022）8188表4用于制定PCP识字测试的原始数据集（修改前）。该表指示数据集的名称、记录的数量、维度的数量维的名称、数据源和说明。第5栏通过引文提供了每个数据集的URL数据集名称记录数维度数维度名称数据源描述汽车392 7英里每加仑，汽缸，马力，重量，加速度，年份和原产地谷物77 11卡路里，蛋白质，脂肪，钠，纤维，碳水化合物，糖，钾，维生素和矿物质，显示架，重量，和杯数为每份Xmdv（Ward，2020）比较1968年至2010年间生产的汽车。1983.Xmdv（Ward，2020）提供营养特性信息在特定的谷物产品中。化学元素109 33名称、周期群、化学符号、原子质量、发现年份、密度、熔点、沸点、熔化焓、汽化焓、摩尔熵、原子化焓等高D（Brodbeck和Girardin，2021a）记录元素周期表中化学元素的特征属性。煤炭灾害191 5个月、年、年中的一天、间隔和死亡人数能源51 12国家能源消费总量人均能源消费居民部门商业部门工业部门交通部门石油天然气煤电水电核电橄榄油574 11面积，地区，棕榈酸，棕榈油酸，硬脂酸，油酸，亚油酸、亚麻酸、花生酸、二十碳烯酸、测试/培训小费244 7总账单，小费收集，性别，吸烟者，天，时间（白天/晚上），团队工作US Election 3111 53 name，state name，Bush，Kerry，Nader，total，male，female，obese，unemployed，rent，pcturban，urbrural，etc.美国人口75 5年，总人口，百分比变化，常住人口和平民人口Venus 8784 7日期，小时，纬度，经度，PV等离子体，速度（km/sec），PD等离子体密度（no/cc）和PT等离子体温度（K）。Xmdv（沃德，2020）记录了一些煤矿事故在1851年3月15日到1962年3月22日之间。Xmdv（Ward，2020）记录美国各州的能源消耗在能源类型和使用部门方面，能量Mondrian（Theus，2021）描述了八种化学测量方法，意大利不同地区生产的不同橄榄油样品。Mondrian（Theus，2021）收集数据以显示小费购物中心内的餐厅的行为。蒙德里安（Theus，2021）记录2004年美国的总统选举，包括选民的人口统计特征Xmdv（Ward，2020）提供美国人口普查数据，1900–2006数以千计。Xmdv（Ward，2020）金星大气数据是面向时间的是从美国宇航局的一次任务中收集图五. 用于制定PCP识字测试的平行坐标矩阵。矩阵指示用于创建PCP图像的数据集和工具的名称。由于Tipping数据集具有许多文本属性，因此未使用无法读取文本数据的工具创建PCP图像（见表3）。图像. 由于工具的一些限制，我们在生成PCP时遇到了一些困难并非每个工具都提供相同的功能，例如显示可见和大轴标签、彩色图、显示最小值这些障碍激励我们尝试使用不同工具的数据集组合，以确定最适合测试的图像（见图5）。图5中只选择了一些图像-我们试图只选择那些高质量的图像。由于颜色对一系列参数（如美学、颜色映射和可见性选项）都很有用例如，颜色映射用于一维上的数据变量，有时。颜色也用于修改背景以显示对比鲜明的背景色。此外，我们希望确保聚类、模式、离群值和相关性在图像中保持平衡。我们的图像选择标准也是基于使用抗锯齿和颜色映射的折线。我们忽略了那些有分散注意力的背景或背景颜色干扰了图像颜色的图像有关测试中结束的图像，请参阅表1。4.4. 推出PCP识字测试该测试旨在检查平行坐标设计的不同方面的理解和视觉设计方法E.E. Firat，A. Denisova，M.L. Wilson等人视觉信息学6（2022）8189见图6。 PCP识字测试问题示例。哪个变量与失业率有间接相关性？选项：（A）布什，（B）克里，（C）纳德，（D）不（三）以上都不是。完整的问题可以在Firat和Laramee（2020 b）找到探索和分析。对于读写能力测试，每个数据集和工具的平行坐标图像矩阵（见图1）。5）被用来告知最适当的例子，提供一个好的颜色选择和显示数据属性正确的图像。从集合中，我们根据表3中的属性选择了最高质量的图像。完成测试的PCP图像选择后，我们为每个PCP图像准备了带有多项选择答案的测试问题是基于之前的用户研究得出的（ Claessen 和 Van Wijk ， 2011;Kanjanabose 等人， 2012 ）。， 2015 年 ;Kwon 和 Lee ， 2016年;Siirtola和Räihä，2006年），涉及平行坐标和第3节中确定的障碍。我们选择从这些研究中得出一些测试问题，因为它们已经通过了评审过程并得到了评审员的批准。PCP问题分类：我们根据第3节中确定的障碍对每个问题进行了分类。一个例子是显示在见图。六、（S）空间要求用户在PCP中搜索特定数据点。（M）多变量需要理解两个或更多变量。(C) 相关性

下载后可阅读完整内容，剩余1页未读，立即下载