深度卡尔曼滤波图卷积神经网络用于交通数据异常检测

77 浏览量更新于2024-01-27 收藏 1.88MB PDF 举报

异常检测

计算机科学

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

沙特国王大学学报季节性深度卡尔曼滤波图卷积神经网络孙延申a，刘伟，陆延成a，付开群b，陈芳兰a，陆长田aa美国弗吉尼亚理工大学计算机科学系b美国南达科他州立大学计算机科学系阿提奇莱因福奥文章历史记录：接收日期：2022年2022年5月25日修订2022年5月26日接受2022年5月29日网上发售保留字：交通预测时空融合多粒度季节特征图神经网络异常检测A B S T R A C T交通数据异常检测是交通管理和异常行为识别的关键。在现实世界的情况下，一个异常通常会导致异常观测多个探测器在一个较长的时间。然而，现有的异常检测方法过度利用单个或孤立的特征相互依赖的上下文信息中的异常，不可避免地降低了检测性能。本文提出了S-DKFN（Seasonal DeepK alman FilterNetwork）网络，用于识别持续时间长、覆盖范围广的异常模式S-DKFN利用图对流量数据进行建模，同时研究空间和时间特征以发现异常行为。具体地，使用膨胀时间卷积网络（TCN）来合并多粒度季节特征，并使用图卷积网络（GCN）来提取空间特征。然后，TCN和GCN的输出被馈送到长短期模型（LSTM），并通过卡尔曼滤波器进行合并以进行去噪。引入了一种编码器-解码器模型来预测具有季节特征的业务属性预测的均方误差（MSE）在两个真实数据集上的实验结果表明，我们提出的S-DKFN框架在检测长持续时间和广覆盖范围的异常方面优于最先进的基线方法，特别是其检测事故的能力版权所有©2022作者。由爱思唯尔公司出版代表沙特国王大学这是一个开放的访问CC BY-NC-ND许可证下的文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。1. 介绍智能交通系统（ITS）的目标是在有限的交通基础设施条件下，提高路网的利用率，其核心是缓解交通拥挤，降低交通事故风险。随着无线传感器数量的不断增加，每天都会产生大量的时空交通数据，这些数据为跟踪交通状态和挖掘有关交通堵塞和事故等异常行为的重要见解最近，已经开发了越来越多的基于数据驱动的应用，包括流量监视（Barbagli等人，2011）、交通流预测（Guo等人，2019年; Yu等人，2021年），交通路线*通讯作者。电子邮件地址： yansh93@vt.edu（Y. Sun）、kevinlu@vt.edu（Y.-C. Lu），Kaiqun.Fu@sdstate.edu（韩国）Fu），fanglanc@vt.edu（F. Chen），clu@vt.edu（C.-T.鲁）。沙特国王大学负责同行审查（Megalingam等人，2011）和流量异常检测（Liu例如， 2011年）。事实上，交通异常检测已成为最重要的问题，由于事实上，交通异常可能是大多数的中断在高速公路交通流的原因。异常检测通常旨在识别表现出意外行为的数据实例。这种技术可以捕获大规模数据集中的流量模式，并检测通常未被发现的潜在信息或可操作的见解。更具体地说，交通传感器报告中的异常可能表示各种潜在问题，例如交通事故、信号故障、交通拥堵、传感器故障以及需要进行通信的未知问题。进一步调查（Djenouri等人，2019年）的报告。许多研究都集中在由偶然活动引入的特定交通异常上（Liu等人，2011年;Pang等人，2021; Pang等人，2013），而其他人则专注于反复出现的流量异常（Chow et al.，2014年）。根据最近对用于检测业务异常的方法的调查（Djenouri等人，2019年），这一研究领域仍处于起步阶段，并且需要利用例如计算智能、优化和高性能计算的额外研究。传统的流量建模方法侧重于捕获时间相关性。自回归积分（AutoregressiveIntegrated）https://doi.org/10.1016/j.jksuci.2022.05.0171319-1578/©2022作者。由爱思唯尔公司出版代表沙特国王大学这是一个在CC BY-NC-ND许可证下的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。制作和主办：Elsevier可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页：www.sciencedirect.comY. 太阳，Y.-C. Lu，K.Fu等沙特国王大学学报4730移动平均（ARIMA）（Ahmed和Cook，1979），支持向量回归（SVR）（Smola和Schölkopf，2004），以及基于深度学习的方法，如递归神经网络（RNN）（Rumelhart et al.， 1985）及其修改版本，门控复发单位（GRU）（Cho等人， 2014）和长短期记忆（LSTM）（Hochreiter和Schmidhuber，1997）以其固有的优势在时间序列建模中得到了广泛的应用。然而，这些方法都无法处理交通数据中固有的地理依赖性。研究已经将卷积网络的概念扩展到图结构数据，方法是在图的边和节点上应用卷积算子（Kipf和Welling，2017）。Yang等人（2020）提出了一种基于图卷积网络（GCN）的鲁棒方法，用于视频中的Valada和Burgard（2017）提出了一种用于地形检测的鲁棒性感知训练方法。马等人（2021）提供了对用于图异常检测的深度学习技术的全面审查。这些方法可以进一步应用于空间相关性建模，从而成为一个有价值的解决方案，捕捉交通数据的时空模式近年来，时空建模技术在交通运输领域引起了广泛的关注许多时空建模方法已经提出，但他们中的大多数都没有被设计来处理大的变化，可能会引入的交通异常。如图1所示，区分交通事件和常规拥堵是一项艰巨的任务，因为拥堵和事故所表现出的特征通常显示出相似的模式。很明显，左侧的3547号事故和底部的3780号事故的位置以及交通堵塞和事故的速度都导致了下降。因此，传统的只考虑速度特征的方法很难区分堵塞和事故之间的差异，也就是说，由于掩蔽和淹没效应（Bendre，1989），异常往往会影响模型的拟合过程，从而导致模型捕捉到有偏差的模式。流量数据中异常检测的挑战包括（1）时空依赖模型的建立和异常模式的捕获。现有的异常检测模型大多只关注时间关系，而忽略了异常的空间模式，导致大量有价值的空间信息被忽略。失去了。例如，一个入射（图中浅蓝色圆圈内）。 1）经常触发多个相邻检测器异常，其模式变化可以为异常检测提供更全面的信息。(2)隐式异常与规则变差的区别。异常可能导致与常规变化相似的特征模式，而它们的上下文模式是不同的。例如，对于图1中的探测器#825675， 1、晚上9点左右车速下降很可能是车速的规律性变化，而晚上11点左右车速较低则可能预示着发生了事故。这一挑战使得在考虑空间时间依赖性和流量连通性的同时捕获模式变得尤为重要（3）在缺乏正常参考的情况下保持鲁棒性。交通事故可能会影响几个相邻的检测器测量的速度延长的时间。如图1所示，事故#3547持续了两个小时，覆盖了探测器#825675的所有邻居如果仅使用前一个小时的数据进行预测，则探测器#825675的预测值可能非常接近异常值现有的研究要么是基于时间的建模方法，要么是基于欧氏假设的时空建模方法，这忽略了特定路段的交通往往更多地受到连接性而不是到其他路段的欧氏距离的影响的本质。（4）复杂的内部结构。流量异常数据通常具有几种复杂的内部结构，例如趋势性、季节性、平稳性和自相关性。数据的内部结构需要特殊的公式和分析技术。建立有效的模型来研究交通数据中季节性、周期性和不规则性成分之间的相互依赖关系是非常必要的。然后，这些模型用于预测未来时间点的序列为了克服上述挑战，我们提出了季节性深度卡尔曼滤波网络（S-DKFN）是一种基于图神经网络的时空异常检测方法。该模型利用多尺度异构特征来区分异常与其上下文。空间和时间信息的去噪组合确保了正常模式的恢复与很少的正常信息。本文件的重要贡献概述如下。Fig. 1.正常的交通堵塞对事故的速度下降。事故#3547和#3780（带红圈的蓝色标记）影响周围几个传感器（蓝点）的速度测量。Y. 太阳，Y.-C. Lu，K.Fu等沙特国王大学学报4731提出了一种基于时空特征融合的无监督流量异常检测模型S-DKFN，以寻找更全面的异常模式。该模型结合了不同的空间和时间分辨率的功能，同时保持训练样本的原子性。它利用不同的神经网络和去噪技术来产生平滑的预测时间序列。提出了一种机制，通过多级滑动窗口纳入季节性特征。滑动窗口将较大窗口中的历史时间戳转换为季节特征，从而缩短了训练序列的长度该方法提高了长短期记忆网络（LSTM）的有效性，克服了LSTM不能处理非相邻时间戳的设计了膨胀时间卷积网络（TCN）模块和编解码器模块。TCN模块组装不同级别的季节特征，这确保不引入不相关时间戳的噪声。采用编码解码模块将单季节特征扩展为多季节特征，迫使模型丢弃部分小尺度特征，增强S-DKFN的鲁棒性利用卡尔曼滤波器的原理概念进行模型合并。卡尔曼滤波器通过用低噪声特征校正高噪声特征来融合空间和优化的特征和未合并特征的残差用于下一步骤中的预测。我们在两个真实数据集上进行了大量的实验评估S-DKFN的有效性和效率。我们提出的模型进行评估的METR-LA和PEMS 08数据集与不同的持续时间和覆盖范围的异常。所提出的方法优于竞争的方法在多个指标。实验结果验证了S-DKFN在检测长时间和大覆盖率的异常方面优于最先进的方法。本文的其余部分组织如下。第二部分回顾了课题背景和相关工作。第三节界定问题。第4节介绍了S-DKFN的细节第五节在两个真实的交通数据集上进行了实验，论文在第六节结束。2. 相关作品在本节中，我们综述了相关研究主题的文献，即时间和时空建模，一般的异常检测方法，和流量异常检测。2.1. 时间和时空建模时间序列建模时态建模已经被广泛研究了几十年。传统的方法包括历史平均（HA）（Liu和Guan，2004）、自回归积分移动平均（ARIMA）（Hamed等人，1995）、支持向量回归（SVR）（Smolaand Schölkopf，2004）和隐马尔可夫模型（Hyndom）（Rabiner，1990）已被广泛应用于各个领域。近年来，神经网络模型，诸如递归神经网络（Rumelhart等人，1985）及其变体，包括LSTM（Hochreiter和 Schmidhuber ， 1997;Zhu 和 Laptev ， 2017 ），门控递归单元（GRU）（Cho等人， 2014）和WaveNet（van den Oord等人，2016年）也很受欢迎的建模时间序列数据。时空建模传统的建模方法通常基于欧氏假设来捕捉空间依赖性。Bruna等人首先提出了一种空间方法和频谱方法的组合，从欧几里德域到非欧几里德域的神经网络（CNN）（Bruna等人，2014年）。随后的研究扩展了这一思想，并正式引入了GCN（Kipf和Welling，2017），它将卷积算子从基于网格的数据推广到图形数据。最近的文献已经证明GCN在各个领域中实现了优异的性能（Duvenaud等人，2015;Battaglia等人，2016年）。随着GCN的成功，Yu et al.（2018）提出了一种混合方法，用捕获时间模式的门控CNN和捕获空间模式的GCN Guo等人（2019）增强了Yu等人的模型。注意力网络。 Wu等人（2019）提出了WaveNet和GCN的组合，用于通用时空预测。STAWnet（Tian and Chan，2021）是最新的时空预测模型之一，它利用层次时间特征和注意力来提高性能。2.2. 异常检测一般异常检测。现有的异常检测方法可以分为两大类（Pang等人，2021），即异常测量相关学习和通用特征学习。异常测量依赖的方法集中于测量特定的异常测量。例如，基于距离的方法（Knorr和Ng，1999; Ramaswamy等人， 2000）、一类分类方法（Moya等人，1993; Roth，2005）和基于聚类的方法（He等人，2003年），属于这一类。这些类型的方法被很好地研究，通常很容易实现，但在正态类中与更复杂的分布斗争。通用特征学习方法组基于不是专门为异常检测设计的模型。最近的研究采用深度学习技术来识别异常对象（Ma等人，2021年）。例如，基于自动编码器的模型（Doersch，2021; Lu等人，2017）可以通过重构不良的实例识别异常。基于生成对抗网络（GAN）的方法（Schlegl et al.，2017;Hundman等人，2018;Medico，2020）的目标是学习一个隐藏的特征空间，可以捕捉正常的，从而通过实际实例和生成的实例之间的差异来检测异常。基于图的深度学习方法也是用于探索异常社区的强大工具，因为它们可以创建节点属性和社区结构的更强大的表示（Liu等人，2020年; Su等人， 2021年）。这些类型的方法通常用于图像或视频异常检测（Liu等人，2018年; Ye等人， 2019年）的报告。流量异常检测。流量异常检测一直是在数据挖掘、城市计算和交通领域进行研究。已经探索了检测异常业务状态的各种方法。Liu等人（2011）提出了一种基于将GPS轨迹数据转换为区域图来检测时空异常序列的早期研究，并根据同一时间帧内每对图链接之间的属性距离来识别异常。Tisljaric等人（2020）提出了一种使用张量分解技术检测GPS数据中交通异常的方法。该方法将交通流模式转换为速度转移矩阵，并根据Kullback-Leibler（KL）散度的显著性来识别异常。Yu等人（2021）提出了一种用于预测交通事故的深度时空图卷积网络。Deb和Liew（2019）提出了一种名为NoiseCleaner的算法，用于识别和纠正大型交通事故数据集中的噪声分类属性值，以避免噪声误导模型。总体而言，大多数现有的流量异常检测方法既不利用图神经网络，也不利用固定的传感器数据。本文提出一种基于鲁棒时空预测模型的新方法，能够检测固定传感器数据集中的交通异常。●●●●●Y. 太阳，Y.-C. Lu，K.Fu等沙特国王大学学报4732.Σ2nω不¼-不不不不不不不不00- ωþ0-α-ωþ0-羟乙基纤维素.Σ03. 问题陈述本部分首先介绍了交通网络和季节特征的定义和表示方法。然后，第3.3节简要解释了预测模型如何作为无监督异常检测模型工作。3.1. 交通网络本文将交通网络看作是一个不规则图G<$V;E;A<$，其中V是一个节点集（jVj <$N）.由固定位置的交通检测器确定。E是边，异常检测模型学习高级模式并在每次篡改时生成一系列预测的网络特征。然后，在异常检测期间，从对应的预测值移除“一定距离”的数据样本3.3.1. 流量预测请注意，Xt2RN×F表示网络在时间点的特征- tampt;xv2RF是网络节点v在时间点的特征，xv;f2R是v在时间点的特征f的值。我们有X t¼ x1;x2;. ; x NTxvv。xv;0;xv;1;.. . ;xv;FT. 具有历史的时代特征连接相关节点，并且ARN×N是E的邻接矩阵表示。节点之间的边由序列t-T p 1; t-T p 2;. ; t和相应的季节性特征St-Tp1;St-Tp2;. ;S t在长度为s的时间窗口中，检测器之间的测地距离或道路距离，这是基于较近的节点彼此更相似的假设。每个节点目标是估计特征xvt1;xvt102;......的人。;xvtTpredo每个传感器报告流量测量（例如，平均速度、交通量和车道占用率）。图2示出了流量检测器网络的示例。红点表示探测器的位置，这些探测器是设置在道路沿线固定位置的传感器。连接检测器的线是节点之间的边。边缘的不同颜色表示检测器节点之间的各种测地线距离。3.2. 季节特征给定时间序列t0; 1;... ;T1;T.在每个时间戳，G中的N个检测器中的每一个产生F个交通状况特征。原始数据矩阵表示为X1; X2;. ; XT_2R_T×N×F。考虑当前时间是t0，并且sp时间戳用于季节特征提取。季节性特征是St ¼Agg. X tSp 1;. ;X tS1p 1;. ;X tp1;. ;X tT 2RN×F，节点v在时间戳t = 1; t = 2;. t T pred，其中T pred是要预测的时间戳数量。3.3.2. 异常检测通过均方误差（MSE）或平方误差和（SSE）估计原始数据样本到预测值的距离如果数据样本的MSE或SSE值比阈值更重要，则将其视为4. 方法该研究将交通网络中的一系列记录转换为异常分数，分为三个步骤：从原始数据中提取季节特征（第4.2节），产生预测结果（第4.3节），并将预测特征转化为异常其中Agg是所采用的聚合函数。也就是说，季节性要素是Tp个连续时间戳的聚合，每个p时间戳在不同的s和p下，该模式可以包含不同时间分辨率的季节特征。用于生成一个时间戳的季节特征的时间戳的数量是maxfsiωp ig;i 1/4 0;1;... ;L，其中L是不同对;对。3.3.基于无监督预测的异常检测基于预测的异常检测模型主要有两个任务：预测和异常检测。对于预测，评分（第5.4节）。4.1. 初步对时间序列分解和卡尔曼滤波进行了理论分析和公式推导。时间序列分解用于季节特征提取，卡尔曼滤波器用于合并空间分析模块和时间分析模块的输出。这两种方法被用于Facebook先知（F.C.D.S.）。team，2017）和DKFN（Chen等人，2020年，分别。请注意，本节使用的符号系统独立于本文的其他部分图二、具有边的流量检测器节点红点是沿着道路分布的探测器在阈值内的测地线距离的节点之间构造边Y. 太阳，Y.-C. Lu，K.Fu等沙特国王大学学报4733122ð Þ¼ð Þ21.b1-1的t0ð Þ22r2 2不p我不不不从原始时间序列中分离出来。St是平均值推断合并估计x是x1的加权和不不t-pt-pt-k ωNpt-k ωNpp1212þþ0p0t1不0- 1ω 1-p0- 1ω 1-p0þt1þþ的t0s111/2 2124.1.1. 时间序列分解时间序列分解（Enders，2004）是一种广泛应用的技术，W的解析解为：R2用于ARIMA（Ahmed and Cook，1979）和Facebook-Prophet（F.C.D.S.团队，2017年）。任意时间序列Yt总是由趋势序列Tt、季节序列St和残差序列Rt组成。的合成方法可以是添加剂（Yt/Tt/St/Rt）或w11月2日^x和r2是：xr2x1r2x2r2r2r212ð8Þ乘法（Y T S R）。添加剂方法将是^^2r1;21/2 2ð9Þ不 ¼不ω不ω不r12021月2日作为下面的一个例子以确定的周期p;Tt在时间槽不是计算通过一为中心均线不 tP½-p;p]Y I. 由S和R引起的在预测模型中，考虑x1和x2是由两个不同模型生成的从等式9、可以--和x，其中权重是r2分别和r2的 . Y-T;Y-T;. ;Y-T，其中N是2r2r2r2r2期间的数量基于回归的时间序列分析模型利用整个训练数据集进行季节特征估计。为了保持训练数据样本的分子特征，本文采用长度为Nwpωp的滑动窗口来计算最后p个时隙的季节特征，其中Nwp是滑动窗口中包含的样本数.4.1.2. 卡尔曼滤波卡尔曼滤波器经常用于回归和深度学习模型（Coskun等人，2017年; Lu等人，2018），因为它能够通过最小化它们的协方差来合并两个估计。卡尔曼滤波器通常用于通过最小化从历史数据xt和测量值zt 1合并xt 1的估计值的方差的xt= 1。让xt 1¼Axtw，z t1¼Hx t1v，哪里一和H是系数矩阵。4.2. 季节特征提取在交通网络中，诸如速度和占用率之类的属性不会随着时间的推移而增加或减少因此，季节特征St与原始时间序列合并作为时间序列分析模型的输入。在递归神经网络（RNN）中，扩展时间序列的输入会导致训练时间过长，梯度爆炸或消失。因此，采用多层次滑动考虑当前时间为t0，Tp时间戳为t0-Tp 1; t0-Tp 2;. ; t0用于预测。基本滑动窗口的大小为Tp，并且数据包含在滑动窗口中的是X0¼Xt0-Tp1;Xt-T2;. ;XtT2 RTp×N×F。w~N<$0;Q<$0是预测噪声，v~N<$0;R<$0是测量值。噪音。根据xt和xt 1的方差预测的xt 1^x0¼轴，宽1毫米用于季节特征提取的第一个滑动窗口包含 S1 ωp1<$T p 时间戳包括t0，的是X1¼。X tsp T1;X tsp T2;. X t<$T2Rs1ωp1<$Tp×N×F. 时间P0轴AT Q 2þ然后，通过测量值zt 1调整的估计可以写为：在X1上执行序列分解以计算季节性X中每个元素的特征1.根据第4.1.1节中时间序列分解的定义，t0的第一级季节特征S1可以计算为：^xt1¼^x0Kt1。zt1-H^x0Σð3ÞS1¼1 XXt-Tt1 0Pt1I-Kt 1Ht1Pð4Þ其中，t 1/ft0-s1 ωp1;t0-εs1-1 <$ωp1;.. . ;t0g是Tpthele-thele-thele-thele-thele-thele-thele-th。bb0t1在每一个p1时间戳中。Tt是时间戳t的趋势。在这其中K¼Pb0H.HPb0HR-1是卡尔曼增益。启发T Tt1t1在这种情况下，生成的季节特征矩阵的大小也是Tp×N×F的数量是两倍（<$T×N×<$2ωF<$）。由Chen等人于（2020年），我们利用卡尔的主要概念，用于分布合并的man过滤器。这些概念描述如下。对于一个值x，考虑有两个独立的估计x1和x2，x是x1和x2的加权组合：^x¼w1x1mmw2x2mm5mm其中w1和w2是x1和x2 的权重;w1≠w21/4。^x;E^x^w1Ex1w2Ex2 的期望。AsEx1和Ex2是独立的，E1/2x1-Ex1]1/2x2-Ex2]1/20。r2可以写成如：R21/4E。1/2^x-E^x]2μ mX2R其他的s和p可以像s1和p1一样相加。如果使用了L_win-时间戳，则为生成一个输入样本的大小为T p ω NωLωF。4.3. S-DKFN模型如图3所示，S-DKFN模型具有两个组件：用于空间关系建模的空间分析模块和用于时间关系建模的时间分析模块。在本文的其余部分，我们使用GCLSTM来表示空间分析模块，因为该模块由GCN和LSTM模块组成TCLSTM被用来表示时态分析模块，因为它时间卷积网络（TCN）和LSTM结构。GCLSTM是东海岸1/2½x1-Ex1]2w2E.½x2-Ex2]2w1rð6Þ用于模拟每个节点及其邻居之间的交互。同样，“时间关系”描述的12对每个节点的当前时间戳的影响。设w2 1/4w和w11/4-w。为了使r2最小化，在r2之间 W为零：D2dw<$-21-wr2wr<$07在每个时间戳，GCLSTM的输入是邻接矩阵和原始时间序列数据，TCLSTM的输入是原始数据和提取在预处理期间。GCLSTM利用GCN块来提取1 2输入数据的空间依赖性特征，并将t12t1Y. 太阳，Y.-C. Lu，K.Fu等沙特国王大学学报4734eeK2不e-图3.第三章。S-DKFN的网络架构对于每个时间戳，GCN的输入是k跳邻接矩阵和X; TCN的输入是具有季节特征S的X。最终时间戳的输出被发送扩展到XbbS以用于损失计算。LSTM层的一个特性。在TCLSTM中，原始数据和季节特征与膨胀TCN块合并，并发送到LSTM层。LSTM层的输出与卡尔曼滤波器合并，并馈送到下一个时间戳。在最后的时间戳，LSTM的输出与卡尔曼滤波器，然后发送到一个简单的编码器-解码器模块，以生成原始数据和相应的季节特征的预测。该模型的架构可以在图中找到。3.第三章。该模型分别考虑原始数据的每个特征。为了简化符号系统，在本节中，每个节点在每个时间戳的特征数量将被视为1。4.3.1. GCLSTMGCN在图上执行卷积以聚合相邻节点之间的信息代替相邻像素，图卷积层将链接的节点视为经典的方法是在频域中使用拉普拉斯矩阵执行图卷积，并学习k，如“k-hop neighbors”中的k，以使用在这个模型中，一个简单的（即，无近似值）ver-采用GCN的方案该方法可以被认为是线性的其中Wgc2RN×nkωNnn是邻接矩阵中元素的可训练权重矩阵表示矩阵的垂直级联。Xt2RN是时间戳t时的输入数据，norm是行-在A上执行的智能归一化方法一个2... 肺炎克雷每个时间戳的输出图卷积特征然后被馈送到LSTM层。对于时间戳t的递归单位，输入门it、输出门ot、遗忘命运ft和时间戳t的值，计算的逻辑单元状态Ct为：[1][2][3][4][5][6][7][8][9][10][11][12]otrWo½Ht-1GCt]bo13ft¼r. Wf½Ht-1GCt]bf14Ct¼tanhWc½Ht-1GCt]bc15其中r是sigmoid激活函数，tanh是正切激活函数。 W i、W o、W f和W c是矩阵的权重，b i、b o、b f和b c是偏置。Ht-1是最后一个时间戳的隐藏状态Ht-1和GCt均为RN×N特征。由于节点之间关系的权重每次都在变化-tamp，最后一个时间戳的单元状态在与当前单元状态合并之前应该被重新加权。将单元状态门添加到原始LSTM模型中：1; 2;...的权重的组合。;k-最近邻每个节点。这样，邻居的影响就可以动态地进行Cω1。W.N.B.诺尔山hA A2。 . . AkiCt1ð16Þ通过系数进行调整。第k个最近邻的权值可以通过邻接矩阵的k次自乘来计算。第1到第k个相邻其中WN是重新加权每个节点的邻居的影响的矩阵。时间戳t的最终单元状态和隐藏状态计算为：矩阵A;A2...一堆叠在一起，形成一个N×kωNω矩阵然后，在堆叠矩阵上执行逐行归一化，因为独立地考虑每个节点的空间关系图形卷积特征GCtRN×N计算为：Ct¼ftCt-1itCt17HtottanhCt184.3.2. TCLSTMG Ct¼.Wgc=norm. hA A2 AkiXt.....ð11Þ在预处理期间，使用L个滑动窗口导致原始输入的L倍的输入大小，并且因此L倍的滑动窗口的数目。Y. 太阳，Y.-C. Lu，K.Fu等沙特国王大学学报4735noe.喜喜.Σe.Σ.2012年12月12日： f← r WHGCjgc; f gc;fgc;j¼11： ogc;j←r. Wgc;oHgc;j-1GCje.ΣΣΣ100bgc;o，;.-;-itc;j<$rWtc;iHtc;j-1TCjbTC;iN线性模型中的参数。在这种情况下，应用膨胀卷积模块来将原始数据与季节特征混合，并将输入大小重新整形为N。膨胀卷积模块包含四个时间卷积层。首先应用N的膨胀和L的核大小的卷积层以将原始数据与季节性数据功能.然后，其他三层合并相邻时间戳的信息。最终输出矩阵的大小为s×N，其中s是第一级滑动窗口中的时间戳数量。然后，时间卷积模块的输出被发送到LSTM层。LSTM的实现与第4.3.1节中的LSTM相同。4.3.3. 卡尔曼滤波在该模型中，数据不被视为地面实况，而是被视为带有噪声的测量值。因此，数据值之间的时间关系和空间关系可能会稍微偏离事实。卡尔曼滤波器通过最小化时间关系模型的预测和空间关系模型的预测的统计分布之间的差异来对预测值进行空间分析模块和时间序列分析模块与卡尔曼滤波器合并。为了避免传统卡尔曼滤波中耗时的矩阵乘法，采用了一种简化的卡尔曼滤波。其基本思想是在每个时间戳上用输出的方差来缩放TCLSTM和GCLSTM的输出。基于等式9、公式为：其中，L是季节特征的数量;y0是原始数据的真实值;y^0是原始数据的预测值; y Sl是通过滑动窗口l提取的真实季节特征;y^Sl 是滑动窗口L的预测季节特征。注意，y 0和y S1都表示业务数据本身，而不是数据的标签。因此，我们的S-DKFN是一个无监督模型。4.4. S-DKFN预测模型的算法在算法1中描述。S-DKFN模型需要三个输入：GCLSTM部分的邻接矩阵和原始时间序列数据，TCLSTM部分的原始数据和预处理过程中提取的季节特征，以及时间赢得的超参数。dow的长度s和邻居的跳数K。如第7行所述，GCN利用GCN块来提取输入数据的空间依赖性特征TCN融合了原始数据和季节特征，并使用膨胀TCN块。这两个模块的输出被馈送到LSTM层进行单独处理（第10-16行）。LSTM层的输出与卡尔曼滤波器合并（第19在最后的时间戳，LSTM的输出与卡尔曼滤波器合并，然后发送到简单的编码器-解码器模块，以生成原始数据和对应的季节特征的预测（第23算法1 S-DKFN模型的工作流程Hkf t¼cωVartc;tωHgc;t1-cωVargc;tωHtc;t;ð19Þ输入：具有最后一个Tp的特征的图G^V;E;AVartc;tVargc;tc其中w是模型中的训练参数。H是合并时间戳nXt-Tp<1 ;Xt-Tp<2;......的人。;Xtoo和相应的kf;t隐藏状态变量gc;t 和变量tc;t 是隐藏变量季节特征nSt-Tp1;St-Tp≥2;......的人。;在时间窗口TCLSTM模块和GCLSTM模块的状态，活泼地Hgc;t和Htc;t是GCLSTM模块和TCLSTM模块的隐藏状态。然后，GCLSTM和TCLSTM的隐藏状态被更新为：长度S。邻居的跳数K。输出：具有特征的图形G/V;E;AX t1;X t2;. ;X tt tTpred在时间戳t 1; t 2;. 我不知道。H0gc;t 1/4。H气相色谱法-Hkf;tZHkf;tð20Þ1：A¼normAA2............. A k2：Hgc;-10]N×F，Htc;-10]N×FH0t c; t¼. Htc;t-Hkf;tHkf;t21最后，时空模块的输出与日常历史数据编码器模块通过一个完全连接的层合并。4.3.4. 编解码器编码器-解码器模块只是一个线性层的堆栈该想法是首先通过减少维度的数量来提取预测特征的高级特征，然后将维度的数量扩展到特征的数量加上季节特征的数量。4.3.5. 损失MSE损失被用来评估模型要预测的特征是Xt 1，季节特征是St 1，损失函数可以写为：3：Cgc;-10]N×F，Ctc;-10]N×F第四章：5：对于j，t-T p 1;t-T p 2;. ;tdo6：//使用GCN和TCN将输入映射到与最后一个时间戳的隐藏状态相同的空间7：GCj←WgcAXj，TCj←TCN XjSj第八章：9：//使用不同的LSTM模块处理空间和季节特征10： ig c;j←. R. W gc;iHgc;j-1GCjbgc;i，otc;j←r. Wtc;oHtc;j-1TCjbtc;oftc;j<$rWtc;f 甲状腺素 1GCjc;f13： Cegcj←tan h. W gc;cHgcj1GCjbgc;c，MSELoss1lωNCtc;j←tanh Wtc;c J-1GCj b/tc;c14：Cgc;j←Wgc;NACgc;j-1，Ctc;j←Wtc;NACtc;j-1“#ωeωeX.OO-2XN .SS-2XN .SS-215： Cgc;j<$fgc;j<$Cωgc;j-1<$igc;j<$Cegc;j，×1/1yi -y^iþ1/1yi1-y^i1我...þ1/1yiL-y^iLð22ÞCtc;j<$ftc;j<$Cωtc;j-1<$itc;j<$Cetc;j（接下页）Y. 太阳，Y.-C. Lu，K.Fu等沙特国王大学学报4736¼gc;.;-;Σ..ΣΣΣΣ;ðÞ.Σ2.Σ16： Hg c;j<$og c;jtanh.Cg c;j，Ht c;j<$ot c;jtan h.Ctc;j十七：18：//使用卡尔曼滤波器合并空间隐藏状态和季节隐藏状态5.1. 数据集我们在两个真实世界的数据集上进行了大量的实验，包括METR-LA和PEMS 08，以评估19：Hkf;jcωVartc;jωHgc;j1-cωVargc;jωHtc;j变量tc;j变量gc;jcDKFN 特别地，METR-LA被用于检验模型针对不同期限的业绩PEMS 08用于模拟-20：H0Hgc jHkf jHkf j21： H0tc;j<$Htc;j-Hkf;j Hkf;j22：Ht：tTpred←W0Hkf;tb0//将1个时间戳扩展到Tpred时间戳估计真实事故的持续时间和范围。我们遵循与现有异常检测研究中类似的过程来注入人工异常（Riani等人，2009年）。请注意，数据集中存在隐式异常。这类异常的例子是23：Ht：tTpred ←Ht：tT pred St：tTpred //合并预测结果在引言部分描述。与S t1;. ;S tt tTpred24：Ht：t<$Tpred<$W3W2W1Hkf;t<$b1<$b2<$b3//用于噪声滤波的25：returnHt：tTpred4.5. 异常评分和复杂性分析通过将S-DKFN应用于一系列交通网络数据，5.1.1. METR-LAMETR-LA是一个包含207个检测器的交通网络数据集。我们提取了2012年5月1日至2012年6月1日的速度测量值，汇总为5分钟平均速度。漏诊率为2：6%。使用线性插值法填充缺失数据邻接矩阵邻接矩阵是基于假设一对节点越接近，它们就越有可能被连接。计算并归一化了地球上节点之间的测地距离。选择小于阈值的距离作为网络的边缘的价值来自时间戳T的第一至T 最后产生的。不一是阈值是通过在Li中设计的实验来选择的等人（2017年）。可以用足够的历史数据预测的第一个时间戳，Tlast是要预测的最后一个时间戳对于每个时间- tampt2Tfirst;Tlast和每个节点v，基于MSE公式计算异常分数：异常世代METR-LA用于评估不同模型如何处理不同持续时间的异常。对于每400个时间戳，添加比每个检测器的最小/最大测量值小/大5-10 mph的异常分数; . yt;v-y^tv223原始数据集。异常的持续时间从10（50 min）至50（250min），步长为10。请注意，如果大于1，则对所有特征应用均值根据吴等的调查。（2020），时间复杂度GCN层为O md第二次其中m是边的数量;n是节点的数量;d是特征的数量。将序列长度表示为l，将季节数表示为s。可以很容易地计算出TCN的时间复杂度为Oln，线性层的时间复杂度为O n .在这种情况下，是O.斯湖mdn d2l n n2。s和l通常都很小，复杂度可以简化为O.mdn d2nn2。空间复杂度为O.ndd2n2。5. 实验在本节中，我们将探讨异常的持续时间和覆盖范围如何影响异常检测的效率这里的持续时间表示异常跨越了多少个连续的时间戳，而覆盖范围是指异常覆盖了多少个相邻节点实验的设计是基于这样的假设：异常的持续时间和覆盖范围会减少模型在预测过程中获得的正常信息。由于缺乏正常信息，预测值可能更接近异常和局部特征，而不是正常和全局模式。我们提出的模型的性能进行了比较，与不同类型的国家的最先进的模型。此外，还进行了烧蚀实验，以验证S-DKFN各模块的有效性。5.1.2. PEMS08PEMS 08数据集由2019年9月1日至2019年10月1日的5分钟平均速度组成。这些数据是由洛杉矶几条主干道上的1150个探测器收集的。缺失率为0：14%，缺失数据采用线性插值邻接矩阵通过与METR-LA相同的策略生成邻接矩阵。平均度数为7：4。边缘长度的平均值和中位数为262： 5m和177： 2 m。最小长度为0： 0 m（自循环），最大长度为799： 2 m。异常世代利用PEMS 08数据集模拟了实际交通事故的时空分布。探测器的测量值在300 m/1000 m/3000 m，事故持续时间被指定为比相应检测器测量值的最小值小5-10 mph的值5.2. 度量异常检测问题通过区分异常与正常来解决。因此，异常检测问题通常被识别为二进制分类问题。精确度、召回率、F1分数和AUC-ROC是检查是否模型可以将相关实例与不相关实例分离，从而用于本研究的结果评估在这四个度量中，精度是正常样本在被标识为“正常”的实例回忆是Y. 太阳，Y.-C. Lu，K.Fu等沙特国王大学学报4737ω¼所有正常

下载后可阅读完整内容，剩余1页未读，立即下载