深度学习方法在集合比较和可视化中的应用

140 浏览量更新于2024-01-24 收藏 1.81MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

视觉信息学4（2020）109CECAV-DNN：使用深度神经网络的集体包围比较和可视化何文斌a，王俊鹏b，郭汉琪c，沈汉伟a，汤姆·彼得卡ca俄亥俄州立大学，美国俄亥俄州哥伦布市bVisa Research，Palo Alto，CA，美国cArgonne National Laboratory，Lemont，IL，美国ar t i cl e i nf o文章历史记录：在线预订2020年4月6日保留字：集合集成比较嵌入式数据可视化深度神经网络a b st ra ct我们提出了一种深度学习方法来集体比较两个或多个集合，每个集合都是模拟输出的集合。集体比较的目的是通过比较集合模拟输出，帮助科学家了解模拟模型之间的差异。然而，集体比较是不平凡的，因为时空分布集合仿真输出的集合存在于非常高维的空间中。为此，我们选择训练深度判别神经网络来测量两个给定集合之间的相异性，并识别两个集合何时以及在何处不同。我们还设计并开发了一个可视化系统，以帮助用户理解基于判别网络的集体比较结果。我们证明了我们的方法的有效性与两个现实世界的应用，包括合奏比较社区大气模式（CAM）和快速辐射传输模式的大气环流模式（RRTMG）的气候研究，和比较计算流体动力学（CFD）合奏与不同的空间分辨率。©2020作者（S）。由爱思唯尔公司出版我代表浙江大学和浙江大学出版社有限公司这是一个在CC BY-NC-ND许可证下的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。1. 介绍在过去的十年中，集合模拟在各种科学和工程学科中发挥着越来越重要的作用，例如计算流体动力学（CFD）、空气动力学、气候和天气研究。科学家通常使用不同的参数进行一组模拟，并通过比较单个运行的输出（即集合成员或简单成员）来研究模拟模型的敏感性。本研究的重点是成员的集体比较为了便于描述，我们使用术语合奏作为一组成员。在这项研究中，我们的目标不是在个别成员之间进行比较，而是集体比较不同的成员群体。对集体集成通信的需求来自许多现实世界的应用。例如，在开发新的模拟模型时，科学家通常对模型与旧模型相比的表现感兴趣，以便科学家能够更好地理解新模型并最终改进它。科学家有时也需要比较*通讯作者。电子邮件地址：osu.edu（W。He），junpenwa@visa.com（J. Wang），hguo@anl.gov（H.Guo），osu.edu（H.-W. Shen），tpeterka@anl.gov（T. Peterka）。https://doi.org/10.1016/j.visinf.2020.04.004仿真模型具有不同的空间分辨率，以选择平衡精度和计算成本的空间分辨率。基于我们与领域科学家的讨论，任何两个集合之间的集体比较的目的是回答三个具体问题：（1）如何度量两个集合之间的总体差异？换句话说，模拟输出的两种分布之间的差异是什么？(2)这两个群体中的哪些成员同意或不同意对方？成员之间的一致或不一致不仅取决于它们之间的相似性，而且还取决于它们在模拟输出的两个分布中出现的概率。(3)什么样的空间区域对区分这两个集合最重要合奏之间的集体比较还没有得到很好的发展。虽然集成可视化技术近年来得到了广泛的研究，但大多数集成可视化技术都集中在比较集成中的单个数据比较多个集合的几个开创性工作包括：（1）分析具有不同空间分辨率的集合的模拟参数（Wanget al. ，2017; Biswas et al. ，2017年），其中重点是参数分析;（2）视觉比较标量值的多个集合/集合（Höllt et al. ，2014）或2D等值线（Ferstl et al. ，2017年）通过并列或叠加，其中重点是特定特征的定性比较。然而，有效2468- 502 X/©2020作者。由爱思唯尔公司出版代表浙江大学和浙江大学出版社。这是一个在CC BY-NC-ND许可证下的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。可在ScienceDirect上获得目录列表视觉信息学期刊主页：www.elsevier.com/locate/visinf110W. 他，J。Wang，H.Guo等人/视觉信息学4（2020）109模拟输出集合之间的可变性的可视化和全面分析仍然具有挑战性。集体系综比较的关键研究挑战是测量两个给定系综的分歧。度量必须包含模拟解决方案的所有值，例如位于高维空间中的每个网格点上的值。一种直接的方法是对每个集合的概率密度函数（PDF）进行建模，然后测量PDF之间的差异。然而，模拟解决方案空间的维数通常是高的建模和比较PDFs。即使我们测量了两个PDF的差异，可视化和分析两个PDF的不同之处仍然是不平凡的（问题（2）和（3））。我们探索使用深度神经网络（DNN）来解决测量高维分布的发散度以进行集体系综比较的挑战。 DNN是一种新兴技术，其使得可以对图像的分布进行建模和比较（例如，生成模型（Goodfellow et al. ，2014; Nowozin et al. ，2016; Arjovsky等人，2017; Gulrajani et al. ，2017; Radford et al. ，2015））。在不对在高维空间上定义的图像分布的PDF进行建模的情况下，DNN方法可以区分一个分布的图像（例如，假图像）与另一分布的图像（例如，真实图像），并且还测量两个分布之间的不相似性。类似地，我们相信DNN方法也有希望可视化和分析两个集合之间的差异。在这项研究中，我们提出了一种方法来执行收集的电子计算和可视化使用深度判别神经网络。判别网络是DNN的一种特殊类型，它可以比较由两组样本表示的两个概率分布。在我们的上下文中，一个判别网络被训练来区分一个集合的成员和另一个集合的成员。通过训练，每个个体成员（来自两个集合）将被区分网络分配一个数值分数，表明该成员来自一个集合而不是另一个集合的可能性。通过对判别网络的输出进行分析和可视化，我们提供了两个集成的三个层次的比较分析来回答上述问题：（1）我们分析判别网络的损失值来衡量两个集成之间的总体差异。(2)通过可视化和分析两个可能性分数集合的分布，可以研究两个集合的个体成员之间的一致性和不一致性。(3)使用判别网络的内部参数，可以表征不同空间位置在区分两个集合中的重要性。此外，为了支持上述三个层次的比较分析，我们设计和开发了一个可视化系统的基础上的判别网络的输出。我们的系统不仅支持单对集合的三级比较，而且支持同时在多对集合之间进行比较（例如，系综对的时间序列）。我们使用两个真实世界的用例证明了所提出的方法的有效性和实用性，并与环境科学领域的科学家验证了结果。在第一种情况下，我们比较了在气候研究中使用不同天气预报模型生成的集合（Yang et al. ，2012）。在第二种情况下，我们研究了空间分辨率对流体动力学领域系综模拟输出该方法可以有效地识别和可视化集成之间的差异。总之，这项研究的贡献是双重的：深度学习方法（CECAV-DNN）用于多个集合的集体比较和可视化。训练判别网络以识别集合如何以及在何处不同一个可视化系统，用于探索和分析判别网络的输出，并考虑到集合之间的差异2. 相关工作在本节中，我们总结了系综可视化和分布比较的相关工作2.1. 包围可视化集合可视化的研究主题有两条不同的路线，即个体集合比较和集合比较.前者的目的是在一个合奏中比较个体成员，后者是在合奏之间进行比较。大多数现有的集合可视化技术集中于分析和可视化集合成员之间的可变性，其可以分为基于位置和基于特征的技术（Obermaier和Joy，2014）。基于位置的技术比较在固定位置处的集合成员的标量或矢量值，并使用伪着色来可视化成员的可变性（ Potter 等人， 2011 ）。， 2009; Hummel et al. ， 2013;Gosinket al. ， 2013; Bensema et al. ， 2016 年 ;Sakhaee 和Entezari，2017年）或字形（Sanyal et al. ，2010; Kehrer etal. ，2011; Jarema et al. ，2015; Hlawatsch et al. ，2011年）。基于特征的技术首先提取特征（例如，等值线，流线）从个别成员，然后比较他们在合奏。对于集合数据集中特征变异的可视化，存在两大类技术。第一组基于特征的技术使用意大利面条图（ Diggle et al. ， 2013; Potter et al. ， 2009 ）、表面切片（SurfaceSlicing）（Mr. ，2012）、屏幕空间轮廓（Demir etal. ，2016），或纱门着色（Phadke et al. ，2012）。第二组基于特征的技术首先导出概要统计（例如，Whitaker et al. ，2013;Mirzargar et al. ， 2014; Raj et al. ， 2016 ），水平交叉概率（ Pöthkow et al. ， 2011 年 ;Pöthkow 和 Hege ， 2011 年， 2013年;Athawale和Entezari，2013年;Athawale等人，2016）、簇（Ferstl et al. ，2016a，b，2017; Kumpf et al. ，2018），密度估计（Guo et al. ，2016）），然后将导出的概要统计编码成可视化。与这些技术相比，我们的工作重点是分析不同的合奏，而不是在合奏成员之间的变化。集合集合的比较集合之间的比较在分析各种模拟模型、研究不同的空间分辨率以及探索集合的时间演化方面起着重要的作用。目前已经提出了一些解决集体系综比较问题的方法，但仍有许多工作要做。现有的技术包括标量值，模拟参数和等值线的合奏之间的比较。Höllt等人（2014）通过可视化每个时间步并排的两个标量值集合的分布，比较了不同空间位置的两个标量值集合。Köthur等人（2015）扩展了窗口互相关矩阵的使用，以支持两个时间序列集合之间然而，Höllt等人和Köthur等人的方法仅限于标量值的系综，并且不适用于标量场系综之间的比较Wang et al.（2017）和Biswas et al.（2017）提出了研究不同空间分辨率气候集合的方法，用于模拟参数的分析和预测··W. 他，J。Wang，H.Guo等人/视觉信息学4（2020）109111精度Wang等人引入了嵌套平行坐标图来可视化分辨率内和分辨率间参数相关性。Biswas等人分析并可视化了不同空间分辨率下集成对模拟参数的敏感性和准确性。然而，Wang等人和Biswas等人的方法主要集中在研究了不同空间分辨率对模拟参数灵敏度和精度的影响预测结果与观察到的地面实况进行比较。模拟场的集合之间的比较，以调查在哪里集合同意或不同意对方是失踪。Pfaffelmoser和Westermann（2013）提出了一种技术，使用沿等值线的梯度着色的意大利面条图和大于等值线的标量值的概率着色的 Ferstl等人（2017）使用时间分层聚类分析了不同时间步的2D等离子体的集合，并使用堆叠的轮廓变化图可视化了聚类的时间演变。然而，Pfaffelmoser等人和Ferstl等人的方法主要集中在两组2D等值线之间的视觉比较。模拟输出分布之间差异的集体比较和可视化仍然具有挑战性。2.2. 分布比较集体系综比较与分布比较有关。在我们的工作中，系综成员被认为是样本，模型定义在高维空间中的分布。我们通过比较由样本建模的分布来比较任何两个系综，并提取对区分两个分布最重要的成员和空间区域分布之间的比较在我们的社区中广泛用于各种应用，例如特征搜索（Wei et al. ，2015，2017; Dutta et al. ，2017a，b; Hazarikaet al. ，2018年）和跟踪（Dutta和Shen，2016年），流线相似性分析（Lu et al. ，2013）、聚类（He etal. ，2017）和降维（Chen et al. ，2015）。在统计学、信息论和机器学习领域，已经提出了各种技术来基于来自每个分布的样本集合来分析两个分布之间的差异。一种简单的方法是为每个分布建模PDF（例如直方图），并比较两个PDF之间的差异。然而，建模和比较高维分布具有挑战性。一系列基于 k- 最近邻的方法（ Wang et al. ， 2009; Poczos andSchneider，2011; Moon and Hero，2014; Póczos et al. ，2012）已经被提出来测量基于样本的两个多维分布然而，由于样本的稀疏性，最近邻搜索在高维空间中变得不可靠Chwialkowski等人提出了最大平均差异（ MMD）。（ 2015 ）， Jitkrittum et al.（2016），Gretton et al. （2007）测量两组样本之间的距离，并确定两个基本分布何时以及在何处不同。然而，许多经常使用的分歧（例如，Kullback-Leibler散度和推土机距离）不受基于MMD的方法的支持。最近，深度判别神经网络在使用分布之间的各种发散/距离来比较由样本表示的高维分布例如，生成对抗网络（GAN）（Goodfellow et al. ，2014; Nowozin et al. ，2016;Arjovsky等人，2017; Gulrajani et al. ，2017; Radford et al. ，2015年）使用判别神经网络来估计真实和虚假图像之间的差异，并更新了Fig. 1. CECV的工作流程，它将一系列集成对作为输入，并为每个集成对训练判别网络。训练后，三个层次的比较分析提供了一个交互式可视化系统比较合奏对。基于估计的分歧的网络的权重。Lopez-Paz和Oquab（2016）基于判别神经网络进行了双样本测试。Im等人（2018）使用判别神经网络来评估生成模型的性能。在这项工作中，判别网络被用来执行合奏之间的集体比较，在下面的章节中详细介绍。3. 概述图1显示了CECV的工作流程，以共同比较多个集合。我们方法的输入是一个序列系综对（例如，用不同仿真模型生成的系综对的时间序列），其中每个系综是成员的集合（即标量场）。我们先训练一系列判别网络，用于对系综对进行比较分析。然后，我们设计和开发了一个可视化系统，以方便比较分析的基础上训练的判别网络。我们训练一个判别网络来区分每对集合。训练后，判别网络为每个成员分配一个似然分数，这表明该成员来自一个集合而不是另一个集合的基于训练的判别网络的输出，我们的方法提供了三个层次的比较分析。首先，我们基于判别网络的损失值来度量两个集成之间的相异性。其次，我们比较两个可能性分数集合的分布，以确定两个集合一致的成员或者意见相左第三，通过利用反向传播算法（Rumelhart et al. ，1986），识别在区分两个集合时最敏感的空间区域。112W. 他，J。Wang，H.Guo等人/视觉信息学4（2020）109p联系我们DD我的天DDDDDDDD我们设计和开发了一个交互式可视化系统，以方便对训练好的判别网络进行分析，从而实现上述三级比较分析（详见第5节）。对于第一级分析，总体差异用折线图可视化，其提供信息提示以帮助用户关注序列中的特定对以进行进一步探索（例如，在具有最大相异度的时步处的集合对）。一系列的小提琴图被用来编码和比较的第二级分析的似然分数对于每个小提琴图，用户可以通过刷动探索PDF的不同子范围，并可视化相应的成员以及敏感的空间区域，以进行第三级分析。图二. 判别网络D的结构，其以序列开始卷积层，然后是几个完全连接的层。4. 集体系综比较我们的方法从一对系综P= {p0，p1，. . .，n−1 和Qq0，q1，. . .，q m−1 .集合中的每个成员pi或qi是标量场，并且场的不同位置处的值表示来自相应集合运行的某个变量（例如，温度、降水）的模拟输出。单个合奏中的成员共享同一空间区域（即：相同的网格离散化）。在数学上，我们将每个成员pi视为RM中的高维向量，其中M是空间场中网格点的数量。然后，两个系综P和Q被认为是从定义在RM上的两个概率分布中采样的两组样本。受生成模型的最新进展的启发（Good-fellowet al. ，2014;Nowozin et al. ，2016; Arjovsky等人，2017; Gulrajani et al. ，2017; Radford et al. ，2015），其使用判别网络来比较由两组样本表示的两个概率分布，我们训练判别网络来量化两个集合之间的相异性并识别其中两个集合不同的成员（或那些成员的空间区域）。具体来说，我们的区分网络通过为每个成员分配似然分数来区分一个集合（P）的成员和另一个集合（Q）的成员，使得两个集合之间的差异P和Q中的成员的似然分数被最大化。在这卷积层卷积层执行线性卷积以从输入中提取特征。由于我们使用的是具有空间连续性的科学数据，因此我们将从一系列此类计算开始，以获取要素图层一层层的每个卷积层由许多可训练的滤波器（即卷积核）组成，每个滤波器可以从输入中提取特定类型的空间特征。此外，由于卷积运算是以固定的步幅执行的，因此每个卷积层的输出通常是输入的下采样版本，其中某些特征被突出显示。完全连接层我们的判别网络的完全连接层将最后一个卷积层的特征映射减少为数值。每个全连接层执行矩阵乘法，为输入的不同元素分配权重对于最后一个全连接层，原始输入（来自最后一个卷积层的输出）被减少为数值（即似然分数）。激活函数卷积层和全连接层的输出将被馈送到一个非线性激活函数中，以从输出中过滤掉冗余元素。相同作为生成模型（Arjovskyet al. ，2017; Gulrajani et al. ，2017; Radford et al. ，2015年），我们使用泄漏整流线性单元（ReLU）作为所有层的激活函数，其定义为通过这种方式，我们将RM中两个向量集合的比较问题转化为两个似然得分a（x） x，如果x>0-cx，否则，（一）inR.在本节的其余部分中，我们首先为我们的基于神经网络的方法提供基础，然后详细说明单对集合之间的三级比较分析。我们讨论了我们的方法可以扩展到比较多对合奏，这是在现实世界中的应用程序中经常需要的。4.1. 判别网络在本节中，我们首先描述了判别网络结构中的基本概念，然后讨论了判别网络的目标函数和训练过程。4.1.1. 架构一个判别网络（如图所示）。（2）是一个非线性函数。此函数映射一个成员，即，一个高维向量，在RM到一个可能性得分在R。具体地，通过线性和非线性函数（即激活函数）的交替序列来实现，其中每对线性和非线性函数通常被称为网络的一层。基于函数对中的线性计算，通常使用两种类型的层：卷积层和全连接层。其中 c 是恒定值，并且通常设置为 0.2 in （ Radfordet al. ，2015）。的可训练参数是卷积层中的滤波器和全连接层中的权重。在这项工作中，我们将由参数φ的集合定义的判别网络表示为φ。为了训练可以区分两个给定集合的判别网络φ，需要通过迭代训练过程基于目标函数来优化参数φ，这在以下部分中详细描述。4.1.2. 目标函数给定两个集合P和Q，我们通过φ将它们映射到两个似然分数集合，并使用目标函数来优化映射，使得两个似然分数集合之间的差异最大化。更重要的是，从可能性得分和优化参数φ的结果集合中，我们能够检测成员，其中，和空间区域，这两个合奏是不同的。各种目标函数（Goodfellow et al. ，2014; Nowozinet al. ，2016; Arjovsky等人，2017; Gulrajani et al. ，2017）已经被提出用于训练区分网络以区分由两组样本表示的两个概率分布。特定目标函数的最大值通常反映了两者W. 他，J。Wang，H.Guo等人/视觉信息学4（2020）109113DFD=DDD;=-f∈F|−|≤ |−|·∥ ∇D+ − ∥−DDDD（c）D←←;+ ×←分配。在这项工作中，我们证明了我们的方法使用Arjovsky等人提出的目标函数。（2017），Gul-rajani et al. （2017），其具有对应于Wasserstein距离（即推土机的距离）的最大值（Müller，1997）。Wasserstein距离可以用来测量彼此不重叠的分布之间的相异性，这对于高维分布很重要通过处理两个系综P和Q，作为来自两个概率分布的两组样本，两个分布之间的Wasserstein距离W（P， Q）被定义为：W （ P ， Q ） =sup （ Ep<$P[ （ f （ p ）） ] −Eq<$Q[ （ f（q））]），（2）其中p和q分别是从P和Q采样的成员，E（）表示期望，f是1-Lipschitz函数（即满足f（x）f（y）xy（对于所有x和y），是一类全为1- Lipschitz的函数.通过将φ限制为全部为1-Lipschitz的参数化函数族（详细信息参见Arjovsky et al. ，2017），目标函数L被定义为：L （ P ， Q; φ ） = Ep<$P [Dφ （ p ） ] − Eq<$Q [Dφ （ q ） ] 。（三）通过迭代最大化目标函数，可以测量P和Q虽然我们在研究中关注与Wasserstein距离相对应的目标函数，但所提出的方法可以灵活地使用与其他广泛使用的距离或发散相对应的目标函数（例如，Kullback–Leibler divergence), which4.1.3. 训练过程如算法1所示，我们讨论了用于相对于目标函数L（P， Qφ）优化判别网络φ的参数φ的训练过程。我们使用随机梯度下降（Bottou，2010）来迭代优化参数φ，如算法1所示。在每次迭代中，从两个集合中的每一个中随机抽取一批成员，并将其送入神经网络（第2-3行）。然后，使用反向传播相对于当前参数φ计算目标函数的梯度（Rumelhart et al. ，1986），其逐层计算从输出到输入的梯度（即，从最后一层开始并传播回到第一层）。注意，我们在损失函数中引入梯度惩罚gp，以加强φ的Lipschitz连续性，如Gulrajani等人所提出的。（2017年）。梯度惩罚被定义为网络输出相对于来自一个系综的成员的加权组合的梯度范数另一个为（φ（φP′（1<$）Q′）2 1）2，其中从0到1随机地采样权重α。基于所得到的梯度，使用具有默认设置（即， α0。001，β10。9，β20。999）（Kingma和Ba，2014），已被广泛用于判别网络的训练。我们继续执行更新参数φ的循环（第1-5行4.2. 两个合奏在本节中，我们将解释如何使用经过训练的判别网络φ来共同比较一对集合。通过分析和可视化目标函数的结果，由φ产生的两个似然分数集合，以及网络参数φ，我们的方法提供了两个集合之间的三个层次的比较分析，详细如下。算法1训练过程的的判别网络φ。参数φ通过从一个采样来初始化。高斯分布随机。b是批量大小。函数random_sample（P， b）从输入集合P中随机采样b个成员。L是目标函数。gp是用于强制φ的Lipschitz连续性的梯度惩罚，如（Gulrajani et al. ，2017），并且λ是被设置为10. α，β1，β2是Adam优化器的参数（Kingma和Ba，2014）。 φL（P′，Q′ φ）是L相对于φ的梯度。输入：判别网络的初始参数φ，系综P和Q输出量：优化参数φ1：重复：2：P′random_sample（P，b）3：Q′random_sample（Q，b）4：φAdam（φL（P′，Q′φ） λgp，φ，α，β1，β2）5：直到满足图三. 使用由经训练的判别网络Dφ产生的似然分数的两个分布来比较两个集合。第一级：差异比较这个级别衡量两个给定集合之间的总体差异。它是通过优化目标函数Eq. （3）两个系综的φ最后，目标函数的最大值可以测量由两组样本表示的两个概率分布之间的距离（即，两个输入集合）。第二级：成员比较该级别确定两个模拟一致或不一致的成员。换句话说，它比较了两个集合中单个成员的出现概率φ的输出，即，似然性得分指示输入成员来自一个集合而不是另一个集合通过φ将两个集合映射到两个似然分数的集合（图2）。3）并将它们建模为两个分布，可以更有效地比较RM中的原始高维成员。例如，对于两个分布重叠的（似然分数的）范围（图中的阴影区域），（3）对应的成员是两个集合的共同趋势，即在这些成员中模拟是一致的。另一方面，对于两个分布不重叠的范围，两个模拟的对应成员高度不同，这可以进一步研究以理解两个分布之间的差异。模拟第三层：区域比较这一层提取空间区域，这是敏感的区分两个合奏（图1）。4）. 它是通过计算每个空间114W. 他，J。Wang，H.Guo等人/视觉信息学4（2020）109∈ [−]−∈=φ∈我J公司简介J.S.J图四、使用反向传播计算的成员的显着图。每个成员的位置影响来自Dφ的似然得分。具体来说，一个成员p iRM 可以表示为pi（s0，s1，. . .其中sj（j0，M1）是与成员的第j个空间位置（网格点）相关联的值;以及该成员的似然得分为Dφ（pi）。通过计算D（p）相对于每个s的梯度，即，使用5. 用于集体比较的我们设计和开发了一个可视化系统，以帮助领域科学家比较合奏集体。可视化系统通过对训练好的判别网络的输出进行可视化和分析，在本节中，我们将描述界面的设计考虑和选择，并为使用我们的系统进行视觉探索提供指导。5.1. 用户界面建议的可视化系统是由三个协调的意见：平行小提琴情节（PVP）的意见，BER视图和显着图视图。每个视图的详细信息讨论如下。5.1.1. 平行小提琴图（PVP）视图PVP视图（图）5（a））包括一个相异性图，一系列小提琴情节，呈现出整体的不同-反向传播（Rumelhart et al. ，1986），我们可以从两个方面揭示sj对pi的梯度的大小测量sj相对于似然分数的灵敏度。当梯度很高时，这意味着sj的微小变化会影响可能性用户感兴趣的集合对的序列的似然性分数的分布。PVP视图用作用户界面，以支持我们的I级和II级比较分析。相异性图相异性图是一种折线图，将序列的不同之处呈现为ensem的序列pi的得分强;·jble对，如图所示。5（a1）。这种直观的可视化梯度的符号表明，当s增加时，成员P1更可能来自一个系综或另一个系综。将梯度的计算扩展到所有s jp i，我们得到显着图（Simonyan etal. ，2013），其具有与pi相同的大小，并突出显示其值对于区分两个集合最重要的空间位置，如图1B所示。四、4.3.扩展到多对合奏我们注意到，在实际应用中，经常需要在多对集成之间进行例如，为了分析两个时空气候集合，科学家通常需要在单个时间步比较两个集合系综对的序列）。我们提出的一对合奏之间的三个层次的比较分析可以很容易地扩展到多对。例如，第一级中的单个数值将成为数值序列，第二级中的两个概率分布将成为分布对序列。当我们扩展分析范围（从一对到多对合奏），以应付现实世界的应用程序，我们认识到需要一个可视化系统。可视化系统可以帮助我们更好地组织复杂的集合数据的不同方面，并方便我们的三个层次的比较分析。此外，视觉探索的过程出现是必要的，以避免信息过载。例如，当面对两个大的时间序列的合奏，用户应该能够得到一个有效的概述，他们首先，概述应该提供信息指导用户的进一步详细调查。友好的用户交互有助于在概述和细节之间灵活切换，这将显著改善探索体验。为了解决这些问题，我们设计了一个可视化系统来支持我们的三个层次的多对合奏的比较分析。该系统的详细信息将在第5节中进一步解释。使得用户能够快速识别感兴趣的对（例如，具有较大相异性的系综对）以用于进一步详细的解释。小提琴图我们使用小提琴图（Hintze和Nelson，1998; Höllt etal. ，2014）来编码和比较似然分数的分布。对于每一对集合，我们首先使用训练的判别网络将它们转换为两个似然分数集合。然后，我们为每个可能性得分的集合建模1D PDF。为了在视觉上比较两个PDF，我们将它们连接成一个小提琴图，将它们作为并列比较的并排视图，如图所示。第6（a）段。对于一系列合奏对，我们将其对应的小提琴图平行排列，以比较它们并跟踪其中编码的趋势。小提琴情节支持两种类型的交互。首先，用户可以点击一个小提琴情节，选择一个合奏对进一步探索。为了集中在选定的合奏对，我们放大相应的小提琴情节，同时又压缩和排挤其他小提琴情节。当关注感兴趣的小提琴情节时，用户可以通过刷动来探索两个PDF的不同子范围。当前小提琴图中的拉丝区域将被传播到其他小提琴图以形成选择带，其揭示了当前所选择的小提琴手在其他合奏中的分布。图图6（b）说明了我们如何计算频带。左侧PDF现在处于焦点中，画笔区域选择成员1、3和4。我们计算当前小提琴图以及所有其他小提琴图（例如，图6（b）中的右小提琴图）。连接所有小提琴图中平均似然分数的一个标准差范围形成选择带。图中的小提琴情节中的两个选择。5（a2）（即，的两个刷状区域）导致两个带。比较宽度谱带之间的重叠和谱带之间的重叠为理解所有系综对中两组选定的成员提供了有用的见解（详见第6.1节）。·W. 他，J。Wang，H.Guo等人/视觉信息学4（2020）109115图五. CECV的用户界面由两个不同的模拟模式生成的气候集合展示：（a）平行小提琴图视图呈现在比较中总体对的总体相异性（a1）以及似然分数分布（a2）;（b）在选择感兴趣的总体对之后以及在对应的小提琴图上刷动，似然分数在刷动范围内的成员在成员视图中可视化;（c）通过馈送将所选择的成员加入到训练的判别网络中，使用反向传播生成显著性图，并在显著性图视图中可视化见图6。（a）将两份PDF文件合并为并排视图，以便进行比较。(b)一个乐队是在刷上小提琴情节后创建的，该情节揭示了当前选定成员在其他合奏中的分布。5.1.2. 成员视图成员视图（图5（b））用于可视化和比较所选成员（即，在小提琴情节的拉丝区域中的成员）。在用户在两个集合中选择感兴趣的成员之后，每个集合中的所选成员被聚合到平均场中。然后将两个平均场在两个并列视图中可视化为两个热图（对于2D场）或两个体积渲染（对于3D场）以进行比较。用户还可以通过从该视图标题中显示的下拉列表中选择成员来检查各个选定的成员（图1）。5（b），默认情况下，视图显示平均场）。当用户更新他们在小提琴图中的选择时，成员视图的内容会相应地更新，以同步选择。5.1.3. 显着图视图显着图视图（图。5（c））的目标是展示我们对选定成员进行的第三层次比较分析的结果，即，对于区分两个集合最重要的空间区域。具体地，将每个选择的成员馈送到经训练的判别网络中，并且计算关于该成员的似然分数的梯度。使用反向传播计算，以生成显着图（详见第4.2节）。来自不同的所选成员的显著性图然后被聚合成平均显著性图，并且使用热图（对于2D射野）或体积渲染（对于3D射野）进行可视化。为了区分聚合显着性图中的正梯度和与成员视图相同，显着图视图也与小提琴图视图链接，即小提琴图中的任何更新也将触发该视图中的更新。5.2. 勘探指南在使用我们的可视化系统探索和比较集合时，推荐自上而下的探索策略‘‘Overview first, zoom and filter, then details-on-demand’’概述首先是PVP视图（图图5（a））提供了比较中的增强对的总体相异性和似然分数分布。通过比较相异性和似然分数分布，用户可以获得哪些集合对彼此更相似/不相似的概述。从那里，他们可以识别感兴趣的合奏对进行进一步的探索。缩放和过滤在识别出感兴趣的合奏对（例如，具有大相异度值的合奏对）之后，用户可以通过点击相应的小提琴图来关注该合奏对。这种交互将通过放大来突出当前的小提琴图，同时压缩和推开其他小提琴图，如图所示。5（b）.从当前聚焦的小提琴情节，用户可以在小提琴情节的任一（或两个）侧（表示两个合奏）上刷，以选择成员的子集用于进一步探索和分析。当用户从每个集合中选择一个成员子集时，所选成员将在成员视图中进行可视化和比较（图1）。 5（b））。此外，所选择的成员也被馈送到训练的判别网络中以生成它们的显著性图，这些显著性图将在（图1）中被聚合和可视化。 5（c））。从显着图的角度来看，重要的空间区域在区分两个合奏可以定位。116W. 他，J。Wang，H.Guo等人/视觉信息学4（2020）109×6. 案例研究我们通过两个实际应用证明了CECV的有效性：一个比较了不同模拟模型生成的气候集合（第6.1节），另一个比较了不同空间分辨率生成的CFD集合（第6.2节）。6.1. 不同模拟模式气候集合是使用天气研究和预报（WRF）区域气候模式生成的，该模式具有两个不同的物理子模式：CAM与RRTMG。模拟域位于南部大平原地区（纬度：25°N 空间分辨率为87（纬度）89（经度）。这些模拟为每个子模式生成了一个集合，使用150个不同的参数设置来预测2007年6月30天的降水。因此，2007年6月的每一天为每个子模型制作了150个成员的集合使用我们的三级集体比较方法，我们比较我们的可视化系统中的两个合奏。6.1.1. 第一级：相异性比较30天的集合对的总体差异在图5（a1）中以折线图的形式可视化。我们首先评估所提出的方法的准确性（图中的绿色曲线）。5（a1））与地球移动的距离（红色曲线图。 5（a1））基于（Rubner et al. ，1998年）。我们可以看到，用两种方法估计的相异性随着时间的推移具有相似的趋势。从折线图中，两个模型高度一致（例如，第4、5和6天）或不一致（例如，第2、11、和13）可以容易地识别。在总体差异性的指导下，可以选择具有代表性的日期进行进一步的探索，例如两个模型之间具有较高差异性的日期。6.1.2. 第二级：成员比较从第一个层次的比较来看，第11天最吸引我们的注意力，因为这一天的两个合奏有很大的不同值。选择第11天后，两个模型的似然分数分布在图中突出显示。5（a2）. 通过比较两个似然得分分布，我们可以看到两个分布有一些共同的非零概率范围，表明两个模型产生的结果在相应的成员中彼此一致。我们还可以看到，RRTMG模型（即橙色PDF）的分布覆盖了CAM模型（即蓝色PDF）概率为零的某些范围。这些范围表明RRTMG模型中的相应成员与CAM模型中的成员有很大的不同。通过刷这两个分布，用户可以选择可能性得分落在一定范围内的成员。例如，在图5（a2）中，从两个集合中选择两组成员。通过这些选择，还生成两个波段（每组成员一个）。从这两个波段中，我们发现所选择的成员很少相互重叠，这意味着随着时间的推移，这些成员的模拟相互不一致。平均场在图5（b）中显示并比较了第11天两组选定成员的基因组。我们观察到，在两组选定的成员中，美国中部的降水量高于其他地区。然而，从RRTMG模型中选择的成员（具有较高的似然分数）在美国中部地区的降水量高于见图7。第13天两个模型之间的比较：（a）似然分数分布和选定范围;（b）选定成员的聚合显着图;（c）、（d）、（e）和（f）范围（a1）、（a2）、（a3）和（a4）内选定成员的平均值。（a3）和（a4）。从CAM模型中选择的成员（其具有较低的似然分数）。第13天的合奏也有非常高的相异性（如图11中的折线图所示）。5（a1））。为了探索来自两个集合的成员，通过刷两个似然分布选择四个范围，如图1A和1B所示。7（a1-a4）。在图1A和图1B所示的范围内，各成员的平均场。7（a1）和（a2）在图中示出。7（c）和（d）。与第11天相似，我们发现两个模型预测美国中部的降水量较高，RRTMG模型预测的降水量总体上高于CAM模型。图图7（e）和（f）示出了由图7（a3）和（a4）指示的范围内的成员的平均场。虽然模拟在这些范围内的一些成员上彼此一致

下载后可阅读完整内容，剩余1页未读，立即下载