没有合适的资源?快使用搜索试试~ 我知道了~
视觉信息学7(2023)77研究文章识别、探索和解释多变量时间间隔中的时间序列形状Gota Shiratoa,b,Natalia Andrienkoa,c,Gennady Andrienkoa,caFraunhofer IAIS,Sankt Augustin,53757,Germanyb波恩大学,Regina-Pacis-Weg 3,波恩,53113,德国cCity,University of London,Northampton Square,London,EC1V 0HB,UKar t i cl e i nf o文章历史记录:接收15十一月2022收到修订版2022年12月25日接受2023年2023年1月19日在线提供保留字:多变量时间序列时间间隔a b st ra ct我们引入了一个概念的插曲,指的是一个时间间隔的动态现象的发展,其特点是由多个时变属性。表示单个事件的数据结构是多变量时间序列。为了分析集合的情节,我们提出了一种方法,是基于识别特定模式的时间变化的事件内的变量。因此,每个事件都由模式的组合来表示。使用这种表示,我们应用可视化分析技术来完成一组分析任务,如调查的时间分布的模式,在情节序列中的模式之间的转换频率,和同现的不同变量的模式在相同的情节。我们使用真实世界的数据,即COVID-19大流行期间人类流动指标的动态和足球队在球周转期间的运动特征,在两个例子中展示了我们的方法。版权所有©2023作者。由爱思唯尔公司出版我代表浙江大学和浙江大学出版社有限公司这是CC BY许可下的开放获取文章(http://creativecommons.org/licenses/by/4.0/)。1. 介绍世界上发生的一切都可以概念化作为表示动态现象的各种事件或发展的一系列情节。在我们的研究中,“事件”一词是指某件事发生或发展的时间间隔。事件的发生或发展具有多个时变属性或特征。包含在连续时间单位获得的多个特征值的数据结构称为多变量时间序列。我们在本文中提出的研究涉及由多变量时间序列描述的事件集合,其中所有特征都是数值,即,表示度量而不是类别。 单个数值属性的值的按时间顺序排序的序列形成某种模式(Andrienkoet al. ,2021b)。当这样的序列由沿着在时间轴上,图案在视觉上被感知为某种几何形状。有形状,即,这些模式不仅容易被人眼检测到,而且也容易解释;此外,它们的含义由特定术语表示,例如“增加”、“减少”、“峰值”等。 因此,间隔内的角特征可以被描述为以下之一:Fraunhofer IAIS,Sankt Augustin,53757,Germany.电子邮件地址:gota. iais.fraunhofer.de(G.Shirato),nataliaiais.fraunhofer.de。Andrienko),gennady. iais.fraunhofer.de(G.Andrienko)。https://doi.org/10.1016/j.visinf.2023.01.001这些简单的图案或几个简单图案的序列。显然,这可以对多变量时间序列的每个单独属性进行然而,由此产生的描述并不能提供对属性的联合行为的直接整体理解。我们要解决的研究问题是如何从识别个体属性的时间发展模式出发,识别和理解它们在一组事件中的联合发展模式。为了研究这个问题,制定具体的分析任务,找到完成这些任务的方法,并测试这些方法的有效性,我们使用了两个真实世界的示例数据集:COVID-19大流行的移动数据和足球比赛中的集体运动本文提出的研究旨在支持以下分析任务。T1:确定主要的时间模式的变化,在情节中的个别特征。T2:研究所识别的单变量时间模式的时间分布T3:研究连续事件中单变量时间模式之间的转换T4:调查事件内不同特征的单变量时间模式的共现任务是基于模式发现的理论模型定义的(Andrienko et al. ,2021b),其进一步被称为“模式理论”。我们并不试图涵盖所有可能的任务2468- 502 X/©2023作者。由爱思唯尔公司出版代表浙江大学和浙江大学出版社。公司这是CC BY许可下的开放获取文章(http://creativecommons.org/licenses/by/4.0/)。可在ScienceDirect上获得目录列表视觉信息学期刊主页:www.elsevier.com/locate/visinf····G. Shirato,N.Andrienko和G.安德里延科视觉信息学7(2023)7778在分析时间序列中,但考虑与分析过程相关的任务,在该分析过程中,从较低级别的模式构建较高级别的模式。在该过程中,任务T1提取较低级别的模式,任务T2-T4旨在发现由较低级别的模式形成的不同类型的较高级别的模式。对于T1,我们引入了一个算法,从单变量时间序列中提取时间T2由时间轴显示支持,并且在适当的情况下,由圆周表示时间周期的圆形图表支持后者可以便于检测时间分布中的周期性重现模式。对于T3,我们提出了显示模式转换频率的二分图。T4可以通过与共现网络交互来实现。本文其余部分的结构如下。第二节讨论了相关的工作。第3节以COVID-19疫情期间第4节通过使用足球数据的另一个应用程序的示例演示了第5节讨论了概念,方法,并回答了研究问题,确定了优势和局限性,并提出了未来工作的方向最后,第6节结束了我们的工作。2. 相关工作我们介绍了以前的方法,模式检测,解释和可视化适用于多变量时间序列的情节。2.1. 概念基础Collins等人(2018)将模式定义为从各个项目抽象的多个(数据)项目的整体表示。数据模式的概念和现有的定义在不同的研究学科已经广泛讨论了Andrienko等人。 (2021 b),他认为模式是由数据项之间的关系形成的。数据模式涉及至少两个集合的元素,例如,时间单位和数值属性的值。模式是由这些集合中的元素之间的内在关系和来自不同集合的元素之间的对应关系构成的前者取决于集合的性质,后者在数据中定义。其中一个集合的元素之间的内在关系创建了另一个集合的对应元素的特定排列模式是第二组元素在整个排列中相互关联例如,时间单位之间的内在关系是时间排序和时间距离,即,两个单位之间经过的时间排序和距离的内在关系差异)也存在于数值属性的值之间。数据集指定哪些属性值对应于哪些时间单位。时间单元之间的内在时间对应属性值的序列。模式是指序列中的值彼此不同的方式:序列中更远的值是否大于或小于前面的值或几乎等于它们。根据这些关系,我们确定了增加、减少或恒定。将数据模式定义为关系系统意味着可以通过满足两个要求的可视化来实现数据模式的可视化发现:(1)根据数据组件的类型适当地表示模式形成关系,以及(2)促进多个数据项的整体感知。因此,在数字时间序列的情况下,(又名:时间图)是一种合适的可视化:两个轴适当地表示时间单元之间和数值属性值之间的排序和距离关系,该坐标系中的点的位置精确地表示时间单元和属性值之间的对应关系,并且通过用线连接点来促进整体感知因此,时间模式被感知为所得到的多边形链的特定形状。因此,可以通过识别形状来发现时间根据模式理论(Andrienko et al. ,2021 b),已经发现的数据模式可以被视为对其应用后续分析步骤的新的数据元素。该分析涉及确定贯穿由其他数据组件的元素创建的布置的模式之间的关系模式是如何随时间变化的,或者它们在空间上是如何分布的。2.2. 时间模式提取与分类在Aigner等人的专著中可以找到对时态数据的可视化分析方法的全面概述。 (2011),Andrienko et al. (2020)和Tominski和Schumann(2020)。模式提取的一个重要前提是将多元时间序列分割成语义上有意义的片段。Bernard 等人的论文 ( 2016)和 Gharghabi et al.(2019)提出了视觉交互和计算方法来分割。进一步的工作提出语 义 分 割 的 基 础 上 Andrienko 等 人 。 ( 2017 ) 及 其 扩 展(Andrienkoet al. ,2021a)。存在用于时间模式提取和分类的两个主要构建块首先,存在搜索由其形状指定的图案其次,相似性度量(也称为距离函数)用于量化相似性和检测时间序列中的模式。几篇论文提出了单变量的时间模式库(Mauceri et al. ,2021)或多变量(Yeh et al. ,2017)时间序列。Das等人应用数据驱动的方法来识别具有可解释和可识别形状的模式(Das等人,,1998年)。提出了用于测量与预定义模式的相似性的算法,用于检测包含给定模式的时间序列(Lu et al. ,2022),并且相比之下,用于检测时间序列中的不相似的连续性(Keogh et al. ,2007)。模式检测和分析的其他方法包括将时间序列表示为聚合(Keogh et al. ,2001)或作为符号序列(Lin et al. ,2007)。在我们的工作中,模式识别的一个新的算法,计算最大的三角形内的时间序列,以确定模式的形状。该算法的思想起源于Steinarsson,他旨在对时间序列进行下采样以进行视觉表示(Steinarsson,2013)。与最常见的方法,这是基于计算的相似性,以前定义的形状,无论是从图书馆或草图的用户,我们的方法考虑到时间序列片段的几何特征,并提供了一个有用的机会,表示在一个高度示意性和紧凑的方式使用两个或三个点的模式。除了对预定义模式的提取和模式类型的识别的研究之外,还有一些工作是通过聚类的方式隐式地识别时间序列模式,假设每个聚类定义了某个模式。Van Wijk和Van Selow(1999)举例说明了Schreck等人(2007)提出将两个变量的时间序列视为2D空间中的轨迹将长时间序列划分为剧集,对剧集的聚类,并将原始时间序列G. Shirato,N.Andrienko和G.安德里延科视觉信息学7(2023)7779被表示为针对集群生成的平均轨迹形状的序列。从我们的工作的角度来看,这些方法是有趣的,因为它们专注于探索时间模式的分布,而不仅仅是模式检测和提取。2.3. 多变量时间序列和事件可视化多变量时间序列的一个明显方法是创建表示各个变量的时间序列的多个可视化。例如,Janetzko et al. (2014)创建多个水平图(Heer et al. ,2009)来可视化表征足球比赛的片段的多个时间序列。Hao等(2011)专注于显示由线图表示的长时间序列中较早检测到的频繁模式(图案)的出现。Pham et al.(2019)补充了显示奇异变量变化的多区域图,其中按时间顺序排列的雷达图序列显示了变量值的组合。 其他作者努力创建一个紧凑的视图,如Bale等人。(2007),其中每个时间序列由嵌入在圆的扇区中的热图表示。在多变量时间序列数据的可视化探索中使用的一种流行技术是将降维应 用 于 对 应 于 时 间 步 长 的 属 性 值 的 组 合 ( Bernard et al. ,2012;Tanisaro and Heidemann,2019). 在这些作品中,作者处理的是连续的时间序列,而不是事件。在可视化以多变量时间序列为特征的事件时,有必要解决:1. 当事件发生时:用线性表示它们的时间参考(Crisan etal. ,2021)或循环时间(Peu-quet,1994;Buono,2016)或结构(日历)模型(Van Wijk和Van Selow,1999);2. 每一集发生了什么:属性的时间动态,通常通过显示时间线来表示(Crisan et al. ,2021)或动画表示,如散点图(罗伯逊等人,,2008; Rosling,2006; Haroz et al. ,2016年)。Zhao等人提出了一种交互式可视化的剧集,便于比较具有不同属性的时间线(Zhao等人,,2012年);3. 多个事件如何相互关联:事件之间的过渡是什么。这可以用一个节点-链接图来表示,其中节点代表模式和链接-它们之间的转换Liu和Mei(2016)。在分析事件发生的时间(何时)时,不仅事件的时间分布是有意义的,而且事件之间的时间关系也是有意义的。Allen和Ferguson系统地介绍了时间间隔之间所有可能的成对关系(Allenand Ferguson,1994)。这些关系可以用Van de Weghe等人介绍的三角逻辑图形化表示。 (2007年)。 Qiang等人 (2012)使用这种方法来表示事件之间的时间关系。Lee和Shen(2009)提出了多变量时间序列中用户定义模式(作者称之为它们将时间序列转换为一系列状态,其特征在于不同的趋势组合,并以矩阵的形式进行可视化表示,其中列对应于不同变量的状态,行对应于不同变量的趋势我们的论文使用了几个视觉表示,结合前面提到的作品的想法。具体来说,我们的时间轴视图的想法(图。 1)类似于Lee和Shen(2009)的状态序列可视化,圆形图表(图1)。六、利用Zhao et al. (2008),并且在各种显示器中通过颜色来表示时间模式遵循Van Wijk和Van Selow(1999)的想法3. 可视化分析方法在本节中,我们将介绍我们的可视化分析(VA)方法,帮助分析师探索和理解以多变量数值时间序列为特征的大量事件。3.1. 方法的实质我们的方法的关键思想是将每个事件中的每个单独的时间序列抽象为时间模式。所有的模式都被分配到一个有限的(最好是小的)类或模式类型的集合中,这些类或模式类型可以用语义上有意义的标签来表示,或者以某种符号形式编码因此,每个单独的时间序列由对对应的模式类的引用表示,并且每个情节由多个属性的模式类的组合表示下面的分析是使用这些事件的表示来完成的。为了简洁起见,我们将在下文中使用术语根据模式理论(Andrienko et al. ,2021b),我们将已经获得的时间模式视为新的数据元素。我们努力在这些新元素相对于数据的其他组成部分的分布中找到更高层次的模式,这些组成部分是被认为是离散对象的事件集和具有时间顺序和距离的内在关系的时间;见第2.1节。因此,基于2.1节中总结的模式理论,我们的方法包括两个阶段:1. 检测和抽象的奇异属性出现在情节的时间模式2. 将单变量时间模式视为数据元素,研究这些“元素”在事件集内和沿时间的分布在这种方法中,我们处理两个层次的复杂性和复杂性的模式。第一阶段发现由按时间排序的数值形成的较低级别的模式。第二阶段的目的是发现由这些较低层次的模式形成的较高层次的模式,由于它们的关系,从而强加的安排内和跨事件。在事件中,多个属性的单变量模式通过共现关系联系起来。在整个事件中,单变量模式通过时间顺序和时间距离的关系联系起来。在第1节中制定的任务T1指的是第一阶段,其余的任务指的是第二阶段。任务T4集中于情节内的共现关系。高级模式的预期类型是哪些单变量模式倾向于频繁地共同出现,哪些不一起出现。任务T3关注时间排序,并努力找到一个低级别模式紧接着另一个低级别模式频繁或不频繁出现的模式。任务T2关注关于沿时间轴的较低级别模式的布置的更远的时间关系,并且在适当的情况下,在时间周期内。较高级别的模式的预期类型包括在时间上更早或更晚或在周期中的某些位置处出现的趋势、在不同时间段中更频繁或更不频繁地重新出现的趋势、以特定顺序出现的趋势等。正如模式理论(Andrienko et al. ,2021b),模式发现由相关关系的忠实视觉表示支持。考虑到与任务T2-T4相关的上述关系,我们提出以下可视化来支持这些任务:G. Shirato,N.Andrienko和G.安德里延科视觉信息学7(2023)7780Fig. 1. Google移动数据中时间模式的时间轴。(For对于图中颜色的解释,请读者参考本文的网络版本。)T2:时间模式的时间轴显示(图2)。 1),其中横轴代表时间间隔之间的线性排序关系,加上圆形图(图1)。6),其中圆圈中的位置表示循环排列关系。T3:相同属性的部分之间的直接转换的二分图(图1)。7)。• T4:共现网络(图1) 8)。任务T1可以以不同的方式完成,例如,通过将时间序列划分为间隔并且根据平均值所落的值范围通过符号对间隔平均值进行编码。产生的代码称为SAX模式(Linet al. ,2007)。在本文中,我们提出了另一种方法,是基于对几何形状的识别,当时间序列用折线图表示时,会形成这种几何形状。应该注意的是,我们为任务T2-T4提出的可视化分析技术不依赖于提取和编码时间模式的方法以及表示模式的标签的选择。我 们 以 Google Mobility 数 据 为 例 展 示 了 我 们 的 方 法(Google,2022)。连续时间序列的日常流动性指标被分为不相交的事件。3.2. 通过实例COVID-19大流行促使地方当局及╱或政府监管人员这些政策导致了流动性的变化,这种变化通常在一定时期内是零星的。我们应该在流动性数据中区分这些零星模式和季节性重复。例如,我们可以预期越来越多的人呆在家里,在圣诞节期间外出的人越来越少。此外,即使在同一时间间隔内,不同类别的地方也有不同的流动在这里,我们的兴趣是可视化跨事件的时间模式,并调查如何流动性随着时间的推移在不同类别的地方变化。数据描述我们对Google(2022)提供的移动性数据进行预处理,以获得多变量时间序列。自2020年2月左右COVID-19爆发以来,谷歌一直在每日发布来自不同地区的6个不同类别的场所(即,零售和娱乐、超市和药房、公园、公共交通、工作场所和住宅)的匿名移动性数据。数据包括与疫情爆发前基准日相比,这些类别场所基线天数代表一周中每一天的正常值,并作为2020年1月3日至2月6日五周期间的中位数公布数据中的数值表示为相对于基线值变化的百分比。从连续时间序列中,我们提取工作日的时间间隔(即,每周5个时间步长)与时间序列的相应段。周末的流动数据被排除在分析之外,因为从工作日到周末的变化非常突出,因此掩盖了流动行为的长期变化。我们处理2020年2月17日至2022年1月7日期间收集的德国流动性数据(即,几乎两年),这导致了五个时间步长长度的99集。为进行验证,我们从牛津COVID-19政府应对追踪系统(Haleet al. ,2021年)。T1个体属性的主要模式是什么?在引言中,我们提到了数值属性的时间变化的简单、易于感知和解释的模式的存在。这些图案可以由特定几何形状的线示意性地表示。让我们使用术语“基本模式”来表示可以用一条直线表示(从微小波动中抽象出来)的模式。有三种基本的时间模式:上升趋势、恒定和下降趋势。更复杂的模式可以被认为是这些序列。图图2示出了元素时间模式如何可以形成更复杂的时间模式。任何时间模式都是从一个基本模式开始的,两个或多个时间模式的序列可以形成一个复合模式,如峰或谷。当序列由相同种类的基本模式组成时(即,上升趋势,恒定,或下降趋势),我们可以简单地··G. Shirato,N.Andrienko和G.安德里延科视觉信息学7(2023)7781→ →图二. 基本时间模式的可能序列。例如,由上-上-恒定-下-下组成的时间模式将被分类为峰值。包括峰值或谷值(标记为 *)的长时间序列可能需要进行细微调整,以区分不同的时间模式。将其视为单一时间模式。例如,两个上升趋势模式的序列形成单个上升趋势模式,并且该时间模式形成具有随后的下降趋势的峰值模式(即,向上向上向下形成峰值)。请注意,当序列变长时,它可以创建更复杂的形状。一个长时间序列往往看起来像一个振荡。它可以通过时间平滑来简化。我们假设所分析的事件很短,因此时间序列包括少量的时间步长,因此可以用足够简单的模式表示。较长的片段可以细分为较短的片段以实现这种表示。另一种可能性是对时间序列进行下采样,即,通过将时间步的长序列划分为少量间隔并取单个代表值(例如,平均值或中值)。我们将一个事件分配给五种时间模式之一,以代表时间序列中最突出的形状:上升趋势,峰值,恒定性,低谷,下降趋势。为了确定时间模式,我们采用了Steinarsson(2013)算法的主要思想,该算法是为时间序列的下采样而设计的从而减少用于表示时间序列的点的数量。这非常符合我们的目标,即将时间序列转换为可以由很少的点表示的简单形状。该方法是基于找到的数据点,使最大的三角形时,连接到第一个和最后一个数据点在一个时间间隔。图3示出了时间序列中最大三角形的示例。图图4示出了模式确定算法的工作,这将在下面解释。当最大三角形的面积大于所选阈值时,时间序列可以被分类为峰值或尽管。为了找到最大的三角形,我们将时间序列的第一个和最后一个点作为三角形的前两个顶点,并依次测试所有中间数据点作为三角形的潜在第三个顶点。从这些点中,我们取一个组成三角形的点,它的面积是所有点中最大的如果最大三角形的面积的绝对值高于阈值,则时间序列具有峰值或谷值;否则,它可以被分类为趋势(向上或向下)或恒定。图三. 时间序列中最大的三角形。当从起点到终点的顺序为逆时针时,面积值被视为负值。否则,面积为正值。时间序列具有带正面积的峰和带负面积的谷当时间序列既不是峰值也不是谷值时,意味着值没有显著偏离连接第一个和最后一个点的直线,时间序列具有以下模式之一:上升趋势、下降趋势或恒定性。想象一个匀速的时间-距离图,其中距离以相同的速度增加。在这种情况下,没有三个点组成三角形,我们定义面积为零。该模式确定相对简单;当开始值和结束值之间的然后,当开始值大于结束值时,时间序列有下降趋势,当结束值大于开始值时,时间序列有上升趋势。G. Shirato,N.Andrienko和G.安德里延科视觉信息学7(2023)7782图四、模式决定的过程。时间序列将被分为A.下降趋势,B上升趋势角Constancy,D.槽,或E.峰表1其频率的时间模式概述(峰/谷阈值=0.1,恒定阈值= 0.2)。我们作为大多数人遵守恒常性峰值上升趋势恒定性下降趋势槽T2 这些模式的时间分布是什么对于这项任务,我们提出了两个可视化集中在不同类型的时间间隔之间的关系 时间轴视图(图 1)着重于线性排序的关系,这些关系由直的水平时间轴上的位置表示。圆形视图(图)(6)关注事件之间的循环时间安排关系。在圆形图表中,工作场所268074年份由环和事件(周数据)住宅348138是顺时针排列的环块在这两种观点中,单个事件的时间模式表示为彩色编码模式检测的结果取决于两个阈值,我们使用这两个阈值来确定波峰与波谷,并识别恒定模式。阈值的具体值并不重要-证明我们的方法。一般来说,这些阈值是特定于应用程序的,并且可能需要领域知识在我们的例子中,我们进行了自我评估,以根据几次试验选择适当的值为了评估,我们使用了一个可视化的时间序列转换到一个共同的起点,如图。 五、表1显示了2000年和2001年的时间模式分布情况。流动性数据。我们观察到恒常性是最常见的模式。这一观察结果可以通过图1中的时间序列可视化来证实。 五、我们的算法旨在提取的模式类型可以被分类为值变化的模式,而例如,SAX模式(Lin et al. ,2007)可以被看作是价值量的模式。我们的算法忽略了值的大小,只考虑相对于时间序列的第一个值的差异。在评估我们的算法对特定分析目标的适用性时,需要考虑到这一点。另一个重要的注意事项是,该算法允许提取比我们在示例中考虑的更精细的模式类型集。因此,对于峰和谷模式,可以基于时间序列的最终值是否增加、减少或保持与第一个值几乎相同来对于上升和下降趋势,可以区分急剧和逐渐增加或减少。可以根据分析的目标选择适当的模式抽象级别。在我们的示例中,我们提取并使用高度抽象的模式;然而,我们演示的探索性技术也可以应用于扩展的模式集时间轴视图(图(1)稳定流动期行为(即,在这两种情况下,流动性指数的变化主要是由于流动性指数的变化(即普遍存在的稳定性模式)和变化时期,在这两种情况下,所有流动性指标或其中一些流动性指标都不稳定。它显示了个体指标的不同模式何时发生,存在什么模式组合,以及它们何时发生。在整个时间跨度中,流行的组合其他组合是罕见的,需要更多的关注来确定。例如,在3月的第三周,当第一次发布封锁时,除家庭外的所有地方的访问量同时下降,而呆在家里的人数则上升2021年和2022年圣诞节期间的类似组合(仅一个组成模式不同其次是呆在家里的低谷和除了公园之外的所有地方类别的高峰。通过观察圆形图表(图6),也可以注意到在两年结束时类似模式的再次出现每个图表便于识别单一属性的 图 6(a),我们清楚地看到,一些时间模式每年重复发生。这些反复出现的模式可归因于数据中所示的季节性变化。例如,在每年年底,“零售和娱乐”、“公共交通”和“工作场所”的特征都有下降趋势我们可以推测,人们在圣诞节期间旅行较少,宁愿呆在家里。虽然圆形图表在揭示单一特征模式的周期性重复方面很好,但检测重复出现的组合需要整合来自六个图表的信息;因此,这种表示不支持模式组合的整体感知。相反,时间轴视图支持对组合的整体感知,但不像圆形图表那样清楚地显示周期性零售和娱乐1007694食品杂货和药房1247724公园1196478中转站10370511G. Shirato,N.Andrienko和G.安德里延科视觉信息学7(2023)7783图五、 实际时间序列,其值已 移动以对齐起始点。见图6。循环显示Google移动数据(a)中功能的时间模式和德国的居家需求水平(b)。在所有图中,内环代表2020年,2021年中期,外环代表2022年。(b)中的值意味着0:没有宣布措施,1:建议不要离开家,2:要求不要离开家,除了日常锻炼,杂货店购物和“必要”旅行,3:要求不要离开家,只有最小的例外(例如,允许每周离开一次,或一次只能离开一个人等),NaN:无数据(Hale et al. ,2021年)。(For在该附图图例中,读者可以理解颜色的含义,请参阅本文的网页版本圆形图还有助于检测时间模式的零星发生,这可能是由不定期发生例如,德国政府要求某些部门或类别的工人关闭(或在家工作)。图6(b)显示,在2020年3月中旬,呆在家里的要求水平从0(没有措施)到2(要求除了日常锻炼、杂货店购物和 图 6,以及在图。第一,我们看到了这一措施的效果:住宅类别在这个时候呈现上升趋势,而其他类别则呈下降趋势。此外,我们还看到,食品和卫生纸)为即将到来的限制或可能的商品短缺做准备。T3单变量时间模式在连续时间内是否有频繁的转换?我们创建二分图来表示连续时间间隔之间的单变量时间模式的转换。它有助于发现时间序列的模式和特征变化的相同和不同时间模式之间的相邻性。在图7中,有六个二分图,每个特征一个,由三个部分组成:两个按比例分段的条和连接条段的曲线。分段条显示了发作中不同模式这些线段绘制在G. Shirato,N.Andrienko和G.安德里延科视觉信息学7(2023)7784见图7。 不同模式之间转换的二分图。(For为了解释该附图图例中对颜色的引用,读者可以参考这篇文章的WEB版本见图8。共现网络与“中转站”的上升趋势突出。使用与时间轴视图和圆形图表中相同的编码来显示与图案相对应的颜色。连接线的不透明度和笔划宽度表示频率由条形图段表示的时间模式的类别之间的过渡。可以交互式地修改此表示,以便仅聚焦于选定的图案例如,恒定性模式之间的最频繁的转换被省略,以便更好地看到其他转换。T4哪些模式经常同时出现?为了回答这个问题,我们构建了一个共现网络,其中节点表示特征的时间模式,边缘连接在同一集中共现的不同特征的模式(图10)。8,左)。节点的大小表示时间模式出现在数据集中的频率,边缘的不透明度和笔画宽度表示同现的例如,我们看到,前往居住地的模式减少和前往工作场所的模式增加请注意,与转换图中相同,两个恒定模式之间的共现是明显的,因此从图表中省略。分析人员可以交互式地选择网络中的节点,用于显示各个时间模式与其他特征的时间模式的最频繁的这种交互式探索减少了图表中的混乱,并有助于找到重要的关系。因此,图8的右边部分展示了选择代表“中转站”的上升趋势模式它表明,这种模式在我们的数据集中只发生了三次,并且在所有情况下,它都与“零售和娱乐”和“杂货和药店”的峰值模式,“工作场所”的上升趋势模式以及“住宅”的下降趋势一起发生这揭示了一种重复出现的多变量时间模式(即,单变量模式的组合)。4. 案例研究:足球中的团队我们证明了我们的方法的一般性,通过将其应用到情节球控球从专业足球(或足球)比赛的变化。在足球比赛中存在着不同类型的位置变化,每一种变化都迫使两支球队从进攻到防守或从防守到进攻。球队可以采用不同的战术。例如,在重新获得控球权后,可能的选择是接近对手G. Shirato,N.Andrienko和G.安德里延科视觉信息学7(2023)7785表2足球数据集中每个特征的时间模式的频率。每个单元格中的两个数字代表两种类型的情节,主队开始防守(左)和客队开始防守(右)。(峰/谷阈值=0.05,恒定阈值=0.1)。峰值上升趋势恒定性下降趋势槽归航深度十四,十六十四,十三十九、六十,六6、11远离深度二十一,十二十,十五十二,九十四、二六、十四起始宽度6、11十,四十,六十、二十一二十七,十离开宽度十一,二七、十三十二,十五二十三,五十,十七家庭距离0,6八、七三十三,三十二十一、九1,0远距离1,0二十三,十三十,二十五九、十0,7avg_vel三十一、二十六五,五1,0七、零十九、二十一目标(即,执行反击)或留在自己身边以保护财产。虽然不同类型的转换通常对人眼可见,但是诸如视频分析师的专家通常必须观看比赛以将转换子分类(例如,将其标记为反击或确保拥有),这是一项耗时且艰巨的任务。本研究的目的是来研究在足球比赛中,哪些多变量时间模式出现在过渡阶段我们通过集体运动的空间特征来描述这些事件数据描述我们提取情节从位置数据的球员在一个职业足球比赛。我们根据特定事件的发生来选择时间间隔,即,改变占有。每个时间间隔由球员在转换前后10秒的位置组成,控球权的变化正好发生在剧集的中间。因此,我们获得了115个片段,每个片段持续10秒(即,250个时间步,假设原始数据的采样率为25 Hz),其中63集看到主队获得控球权,52集显示客队。接下来,我们通过可以从位置数据计算的空间特征来表征时间间隔:团队的紧凑性,距离自己的目标的距离和速度。对于每个团队,我们计算团队宽度(即,垂直于边线的距离,位于最左边的场地运动员和位于最右边的场地运动员之间的距离),队伍深度(即,距离球门最远的球员和最近的球员之间平行于边线的距离,守门员除外),以及球队中心到自己球门的距离。由于我们观察到两支球队的球员之间的平均速度有很强的相关性,我们计算了两支球队的20名内野球员的共同平均速度4.1. T1个体属性的主要模式是什么?如图图9以灰色示出,由许多时间步(在我们的情况下为250)组成的情节可能具有由多个基本模式组成的复杂时间模式。正如第3节T1中所讨论的,时间模式需要足够简单以便于解释。复杂的模式可以通过省略过多的细节来简化,这可以通过时间序列的下采样来实现。我们使用T1中引入的相同算法(Steinarsson,2013)来对剧集进行下采样。图中的红色虚线。9显示如何使用250个时间步的时间序列被下采样为5个时间步长。我们首先将下采样技术应用于每一半的片段,以获得一个代表性的值,该值将形成最大的三角形,其两端位于被分割的一半中。然后,使用我们的算法对下采样的情节,我们分类的时间模式。图图10用颜色示出了所有下采样的时间序列。表2总结了检测到的模式。为属性home_width中,我们观察到一种流行模式,朝向剧集结束(即,上升趋势和低谷)相对于当主队通过防守(单元的左侧)开始该集时的 这意味着主队在获得冠军后往往会扩张,这是足球界的一种已知行为(Fonseca et al. ,2013)。我们 发 现 相 反 的 模 式 ( 即 , down-trends and peaks ) 是away_width中的大多数(63个中的34个)。第二,我们观察home_distance中的上升趋势模式的数量与away_distance中的下降趋势模式的数量相似,以及home_distance中的下降趋势模式的数量与away_distance中的上升趋势模式的数量相似。图11证实了这一发现,两支球队的质心遵循相似的轨迹。第三,我们看到大多数模式在avg_vel中显示为峰值或谷值(63个中的50个)。我们可以假设,控球权的变化可以使球员突然加速或减速,而不是单调地。最后,两支球队之间的显著差异可能是距离球门的低谷模式。我们在主客场只观察到一个波谷型,而在客场观察到七个波谷型.不同的战术,比如让客队尝试比对手更多的反击,可以解释这种变化。4.2. T2 这些模式的时间分布是什么我们使用线性排序来表示时间模式的时间分布。在图12中,表示情节的矩形比图12中更稀疏地对齐。1,因为时间间隔是根据特定事件选择的。图图13示出了图13所示的时间分布的圆形视图。模式每个图表中的两个弧表示时间轴,其中内部弧表示匹配的前半部分,外部弧表示后半部分。虽然不能预期周期性的重复,但是这种视图可以促进对数据的理解因为圆指的是钟面,这允许比较第一和第二半。4.3. T3单变量时间模式在连续时间内是否存在频繁的转换?此任务不适用于此数据集,因为发作是零星出现的。4.4. T4哪些模式经常同时出现?图 图 15 示 出 了 应 用 于 片 段 ( 左 ) 的 同 现 网 络 以 及 与home_distance的上升趋势模式(右)最频繁地同现的五个多变量时间模式,其中主队在中间获得控球权(在5秒处)。home_width向片段结束方向增加的模式的三分之一(即,上升趋势和低谷)与avg_vel的峰值、home_distance的下降趋势和away_distance的上升趋势的组合共同出现图图14说明了这些情节中团队质心的移动。我们从镜头中进一步确定,防守队在自己的一方深处收集长传后,慢慢地重新建立进攻。其他组合,如avg_vel在客队防守时,客场宽度增加模式的同时出现也有类似的趋势。然而,我们观察到更多的反击与avg_velG. Shirato,N.Andrienko和G.安德里延科视觉信息学7(2023)7786见图9。 下采样的时间序列和原始时间序列的叠加,用于到它们的本地深度、客场深度、本地宽度、客场宽度、本地距离。目标,到目标的距离,以及平均速度。包括开始点和结束点的较大的三个点指示用于对时间序列进行分类的点。模式,并与其他较小的两个点一起形成下采样的时间序列。下采样的时间序列被着色以指示分类的时间模式,而原始时间序列是灰色的。中间的虚线表示事件的中间点。时间显示在水平轴上以帧(1/25秒)为单位,而范围从0到1的归一化属性值显示在垂直轴上。见图10。所有下采样时间序列。颜色表示分类的时间模式。时间以帧(1/25秒)为单位显示在水平轴上,而属性值相对于初始点的变化由垂直位置表示。轴根据原始(未归一化)属性的测量单位进行标记。(有关本图例中颜色的解释,请参阅本文的网络版本见图11。在这一集里,团队的重心发生了变化。每一行都描绘了两支球队在八集比赛中质心的变化(左:主场,右:客场)。颜色反映了时间的进程,从蓝色到白色再到红色。(For对于图中颜色的解释,请读者参考本文的网络版本G. Shirato,N.Andrienko和G.安德里延科视觉信息学7(2023)7787见图12。 足球数据中时间模式的时间轴。每行顶部和底部的标记表示进球和换人(球:进球,S:换人。H:home,A:away)。图13岁足 球 数 据 中 时 间 模 式 的 循环时间视图。主队在本赛季结束时排名前三,而另一支球队则在降级区,这一事实解释了这些不同的战术。虽然客队可能更喜欢长传而不是控球,但主队可能在控制球方面感到安全。4.5. 调查结果概述我们的方法使我们能够确定两个团队的相似和独特之处时间模式显示球员在进攻时经常打得很宽,在防守时打得很窄。另外,观察到响应于占有的改变同现图表显示了两种典型的战术,双方使用时,他们获得控球:要么执行反击或逐步重建攻击。在获得控球权后,主队通常会小心地连接传球,而客队通常会尝试快速反击。5. 讨论在这篇论文中,我们提出了一种观点,认为时变现象是一系列事件,即,时间间隔表示
下载后可阅读完整内容,剩余1页未读,立即下载
![application/x-rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://profile-avatar.csdnimg.cn/default.jpg!1)
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![](https://csdnimg.cn/release/wenkucmsfe/public/img/voice.245cc511.png)
会员权益专享
最新资源
- VMP技术解析:Handle块优化与壳模板初始化
- C++ Primer 第四版更新:现代编程风格与标准库
- 计算机系统基础实验:缓冲区溢出攻击(Lab3)
- 中国结算网上业务平台:证券登记操作详解与常见问题
- FPGA驱动的五子棋博弈系统:加速与创新娱乐体验
- 多旋翼飞行器定点位置控制器设计实验
- 基于流量预测与潮汐效应的动态载频优化策略
- SQL练习:查询分析与高级操作
- 海底数据中心散热优化:从MATLAB到动态模拟
- 移动应用作业:MyDiaryBook - Google Material Design 日记APP
- Linux提权技术详解:从内核漏洞到Sudo配置错误
- 93分钟快速入门 LaTeX:从入门到实践
- 5G测试新挑战与罗德与施瓦茨解决方案
- EAS系统性能优化与故障诊断指南
- Java并发编程:JUC核心概念解析与应用
- 数据结构实验报告:基于不同存储结构的线性表和树实现
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035111.png)
安全验证
文档复制为VIP权益,开通VIP直接复制
![](https://csdnimg.cn/release/wenkucmsfe/public/img/green-success.6a4acb44.png)