空气质量预测中异质数据融合及GCN在空间相关性考虑中的应用

112 浏览量更新于2024-01-18 收藏 2.3MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

沙特国王大学学报考虑空间相关性的图卷积网络异质数据融合及其在空气质量预测马正京a，梅刚a，1，刘晓波，萨尔瓦多·科莫b，弗朗西斯科·皮恰利b，a中国地质大学（北京）工程技术学院，中国北京100083b数学与应用系R. Caccioppoli，那不勒斯费德里科二世大学，那不勒斯，意大利阿提奇莱因福奥文章历史记录：收到2022年2022年3月24日修订2022年4月4日接受2022年4月9日在线发布保留字：异构数据源径向基函数（RBF）深度学习图卷积网络（GCN）A B S T R A C T预测某些观测的未来状态的模型通常是通过利用异质数据开发的。大多数传统的预测模型往往忽略不一致和不完善的异构数据，他们也是有限的，在他们的能力，考虑监测点之间的空间相关性作为解决方案，本文提出了一种深度学习方法，通过利用图卷积网络（GCN）融合从多个监测点收集的异构数据，从而对某些观测值进行预测。这种方法的有效性进行了评估，将其应用到空气质量的预测方案。作为所提出的方法背后的基本思想，（1）所收集的异构数据根据监测点的坐标进行融合，考虑其空间相关性，以及（2）预测考虑全局信息而不是局部信息。根据空气质量预测方案，（1）通过基于RBF的融合方法获得的融合数据是合理和可靠的;（2）融合显著地提高了预测模型性能;以及（3）通过融合增强的STGCN模型实现了最高性能。该方法同样适用于研究区域内多个监测点采集的连续异质数据©2022作者（S）。由爱思唯尔公司出版代表沙特国王大学这是一个开放的访问CC BY-NC-ND许可证下的文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。1. 介绍随着物联网（IoT）的发展（Ren例如，2017），从属于不同监测源的多个点收集大量数据，并分散在不同位置（Meng等人，2020年）。这些物联网数据通常包含时间和空间属性，并表现出异质性（Liu等人，2020年）。然而，异构性往往会影响物联网中的数据可用性，从而导致在基于物联网的环境中进行信息交换和决策的困难。为了增加这些不同种类数据的可用性并将其转换为可靠和准确的信息，一种常见的解决方案是数据融合（Okafor等人，2020; Liu等人，2020年）。数据融合融合从多个监测点收集的原始数据以获得改进的信息，这对于提高物联网环境中的数据可用性具有重要意义（霍尔和*通讯作者。电子邮件地址： gang.cugb.edu.cn （ G.Mei ）， francesco.unina.it（F.Piccialli）。[1]请注意，本手稿的预印本已发布在arXiv上：https://arxiv.org/abs/2105.13125。Llinas，1997; Ngiam等人，2011; Liu等人，2020年）。通常，融合信息提供比独立观测更准确的描述，并增加数据应用的鲁棒性和置信度;因此，融合数据被认为具有比单个原始观测更完整的价值（Adio-Ordinas等人，2019; Gite和Agrawal，2016）。此外，数据融合能够扩展时间和空间覆盖信息，并进一步减少多个监测站测量的模糊性和不确定性（Guo等人，2019年）。数据融合在空中交通管制、机器人、制造业、医疗诊断、环境监测等领域有着广泛的应用。涉及异构数据源的典型应用场景是环境监测领域。在这种情况下，所收集的异质数据的一个常见应用是空气质量预测。空气质量预测为政府措施提供信息，包括交通限制、工厂关闭和户外活动限制。通常，需要来自多个不同监测站的不同数据来开发预测模型（Wong等人，2004年）。空气质量取决于外部因素，其中一个最重要的因素是随时间和空间变化的气象条件这意味https://doi.org/10.1016/j.jksuci.2022.04.0031319-1578/©2022作者。由爱思唯尔公司出版代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页：www.sciencedirect.comZ. 妈，G.Mei，S.Cuomo等人沙特国王大学学报3434P¼J拥有大量气象监测站气象条件的异构数据近年来，作为最先进的技术，机器学习算法已经逐渐被应用于开发用于预测空气质量的模型，其中用于模型训练的输入变量通常包括从位于感兴趣区域中的空气质量和气象监测站收集的异构数据（He等人，2018; Enebish等人，2020; Elangasinghe等人，2014; Maharani和Murfi，2019; Zhang等人， 2019年）。虽然这种预测模型表现良好，但它存在一些局限性。首先，对于大多数预测模型来说，为了考虑外部因素，一个典型的做法是气象站的常见观测（例如，温度、湿度、风向）直接作为输入变量（Zhang等人，2019年）。另一种常见的做法是基于诸如时间戳的相同信息来合并气象数据和空气质量数据（Campanile等人，2021年）。遗憾的是，这些常见的实践在不同程度上忽略了各种监测目标之间复杂的多元关系为了解决这个问题，采用线性估计方法融合来自不同监测站的多个观测值，通过考虑每个气象因素的影响以及这些外部因素之间的复杂相互作用，可以为空气质量预测建模提供更有价值的信息（Okafor et al.， 2020年）。然而，该方法没有考虑来自不同监测站的气象数据和空气质量数据的空间和时间分布。其次，这些预测模型主要关注本地信息，并且通常采用有限数量的空气质量监测站进行预测。实际上，很难将这些局部预测作为整个研究区域未来趋势的指标。第三，以前的研究主要将其研究区域视为基于网格的区域以获取地理空间信息（Le et al.，2020; Zhang等人，2019年）。虽然在将研究区域划分为网格时所需的计算相对较快卷积神经网络（CNN）在从空间相关数据中提取局部模式方面是有效的;然而，它们通常适用于标准的基于网格的数据，并且不适合于非网格数据。作为上述问题的解决方案，在本文中，考虑到监测点之间的空间相关性，我们提出了一种深度学习方法，其中融合从不同监测点收集的异构数据，并通过应用图卷积网络（GCN）来预测某些本质上，所提出的方法包括首先融合由监测点收集的异构数据，然后通过利用全局信息（即，来自研究区域内所有监测点的融合信息）而不是局部信息（即，来自研究区域内单个监测点的信息(1) 重点研究了监测点的空间分布特征，并采用基于径向基函数的方法对监测点采集的包含空间信息的异构数据进行融合(2) 我们将整个研究区域内的所有监测点连接起来，构建一个全连通图，从而用图结构的数据取代传统的单个监测点或少数监测点。变量，它由门控卷积神经网络（GCNN）和GCN组成。GCN层捕获构建的图形结构数据之间的空间相关性。GCNN层捕获构造的序列数据之间的时间相关性。(4)我们通过分析从现实世界中的多个监测点收集的数据来评估所提出的方法来预测空气质量。2. 方法2.1. 概述在所提出的方法中有四个主要步骤。首先，我们从分散在研究区域的多个监测点获得原始异构数据，然后进行清洗。其次，我们使用所提出的基于径向基函数的方法，通过考虑的空间相关性，融合清洁的数据第三，我们构建的空间和时间相关的数据的基础上融合的数据作为进一步的预测输入第四，基于具有空间和时间信息的构造数据，我们应用一种新的深度学习模型STGCN进行预测。结合用于空间相关性的GCN层和用于时间相关性的GCNN层，预测模型可以捕获构造数据之间的空间相关性以及时间相关性。2.2. 步骤1：数据收集和清理随着物联网技术的进步，越来越多的监控源可用。结果，监控目标的数量迅速增加，并且在短时间内产生大量异构数据。当利用从多个点收集的异构数据时，应该首先清理数据以从这些原始数据中提取有价值的信息。具体来说，初始步骤包括识别数据中的不准确、不一致或冗余信息。第二步是清洁（即，去噪）数据，这涉及去除不正确的值并解决任何缺失的值2.3. 第二步：数据融合我们假设有一个总数量的S监测点分散在一个研究区域。对于给定的监测源类型m，研究区域具有随监测源类型而变化的Km 个监测目标。在每个时间点，对于属于监测源m的给定监测点s;Ck;m<$s表示其中一个观测值，k表示第k监测目标。在整个研究区域内，所有监测源共监测K个目标，KKm。通常，一对距离较短的监测点之间的相关性比一对距离较长的监测点之间的相关性更强（Tobler，1970）。基于这一概念，我们提出了一种方法来融合从这些监测点收集的异构数据该方法考虑了研究区域内各监测点的空间位置我们将这些独立观测之间的空间相关性引入到基于距离的融合方法中，从而将来自一组监测点的数据与来自另一组监测点的数据根据空间信息进行融合，这两组监测点都在给定的研究区域中，我们假设一组Nj个监测点sj;j1; 2;. . ;Nj属于一类监控源(3)我们采用了一种叫做时空的深度学习模型mj和它的kth观察值为Ckj;mj . 此外，还有图卷积网络（STGCN）用于预测某些另一组N1个监测点s1; i1; 2;. ;Ni，属于Z. 妈，G.Mei，S.Cuomo等人沙特国王大学学报3435我. - 是的ΣX;J;;到另一种类型的监测源mi，其第k个观测值为Cki;mi.根据监测点si之间的距离disti;ji/¼经验-c·dist22哪里高斯RBF。dist表示欧几里得距离。和sj，我们将点si的观测值Cki;misi融合到点sj/中并融合观测值C k;m。点sj到点si。在那里-对于两个监测点si和sj，距离dist=i;j=i-sj。JjhiT因此，对于从分散监测点收集的异质数据，可以采用函数F当权重wj^wl;w2;. ;w Nj线性方程组通过求解F SJ¼C kj;mj sj，我们有Fsickj;mjsi。径向基函数的线性组合能够构造这些监测点的函数F（参见等式（1））。① ①）。作为一种基于距离的函数，径向基函数特别适用于加权和融合来自多个分散监测点之间的空间相关性的大量数据（博伊德，2010年）。在本文中，我们采用了基于RBF的方法来执行融合。在这里，我们采用高斯首先计算上述Nj 个监测点之间的欧氏距离dist，得到一个大小为Nj×Nj的距离矩阵。然后，将这些距离输入到高斯RBF中以获得系数矩阵A，并且A的大小也是Nj×Nj（参见等式10）。（3））。接下来，来自Nj个监测点的观测值为定义为矢量B1/4Ckjmjs1/2;Ckjm js2;.. . ;Ckjm j.s N j t。因此，在本发明中，基函数，即，高斯径向基函数，作为我们的径向基函数（见方程。（2））。NJF¼wj/ jdist1第1页得到一组线性方程AwjB，从而得到：上述权重W，j。最后，上述Ni个监测点产生kj个观测值，即，融合数据，其中kj表示监视源的第k个监视目标m j（参见等式（4））。Z. 妈，G.Mei，S.Cuomo等人沙特国王大学学报3436Fig. 1. 所提出的方法的工作流程。Z. 妈，G.Mei，S.Cuomo等人沙特国王大学学报3437X45/小时667745/小时23w2× ×¼667723C2001年1月1日;2日45×¼ðÞ¼6ð Þ ð Þ ð Þ ðÞ7/dist4; 1/dist 4; 2/ dist 4; 3/dist 4;472/dists1;s1/dists1;s2·· ·/的。距离s1;sNj32/100000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000006/区../dist sS../的。Dist.S.. ...SΣΣ7A¼6/mmdistance 2;1 mmdistance 2;2 mmdistance2;3mmdistance2;4 mm distance72A6英寸2012年2月1日2019 - 02- 2200：00：002;Njdistributed 3; 1000/1000 distributed 3; 2000/1000distributed 3; 3000/1000 distributed 3; 4000/1000distributed4/。距离sNj;s1N j/.Dist.sNj;s2Nj· · ·/的。距离sNj;sNj5ð3ÞNJð6Þ第二，B21/41/2C1;21/1C1;2 1/2C 1; 2 1/2C 1;21/3C1;2 1/4 C]T都是观测从监控源2的第一我们可以从线性方程A2w/B2中求解w：见图2。五、Ckj;mjsiwj/jdisti;j;i¼1;2;· · ·;Ni4第1页在执行基于RBF的融合过程之后，针对单个时间步长获得融合矩阵（FM）（参见等式10）。（5））。的每一行/distributed 1; 1/distributed 1; 2/distributed1;3/distributed 1;4/distributed/dist2; 1/dist 2; 2/ dist 2; 3/dist 2;4distributed 3;1000/1000distributed3;2000/1000distributed 3;3000/1000distributed3;4000/1000 distributed/dist4; 1/dist 4; 2/ dist 4; 3/dist 4;42周1364w375w4矩阵代表一个监控点，每列代表监控目标。研究区有S个监测点和K个监测目标。对于多个时间步长T，融合矩阵的大小为T S K。融合矩阵可用于构造时空相关数据。见图1.一、0C1·· ·C11..|ﬄ ﬄ ﬄ {w zﬄ ﬄ ﬄ}| ﬄﬄﬄ{wzﬄﬄﬄ}C1;22C1;23C1;241FM¼ B@。. ..K.CA5|ﬄﬄﬄﬄﬄ ﬄﬄ{Bz2ﬄﬄﬄﬄﬄ ﬄﬄ}ð7ÞC1-S型· · ·公司简介基于RBF的融合的详细过程如图所示。图2和图3。我们假设有13个监测点分布在给定的研究区域。这些监测点属于三个不同的监测源，不同的监测源用不同的颜色表示：绿色代表监测源1，蓝色代表监测源2，黄色代表监测源3。监控目标的数量取决于监控源的类型。这里，监控源1具有两个监控目标，监控源2具有三个监控目标，监控源3具有两个监控目标，即，研究区共有7以s11监测点为例，介绍了如何进行基于径向基函数的如示于图2，s11属于监测源1，因此，融合操作的目的是将监测源2（包含三个监测目标）和监测源3（包含两个监测目标）的观测值融合到s11的数据中。首先计算属于监测源2的4个监测点之间的欧氏距离，从而得到4×4的距离矩阵和系数矩阵A2系数矩阵A2为：见图。四、第三，这四个点与监测源的距离2到监测点S11是计算为11.第11章第2章第3章第11章第4章第11章第12章第13章第14章第15章第16章第17章第18章第19章第1 3）。最后，通过将这些距离输入到高斯RBF 中（参见等式2），（4）），得到结果C1;2= 11，其中监测点S11融合来自监测源2的第一监测目标的数据。如示于图 3，通过重复该过程，在单个时间步长处获得尺寸为13 7的融合矩阵。这里，13表示13个监测点，7表示7个监测目标。在添加时间信息之后，组装的融合矩阵可以用于构建时空相关数据以用于进一步的模型预测。2.4. 第三步：数据构建2.4.1. 空间相关数据采用加权全连通图GVt;E;Aw来表示多个监测点之间的非欧空间相关性，其中Vt是一组节点，代表研究区域内S个监测点的数据。每个节点都与其他节点相连，这意味着整个研究区域内的所有监测点之间存在重叠（每个Z. 妈，G.Mei，S.Cuomo等人沙特国王大学学报3438图二.从分布在研究区域的多个监测点收集异构数据的示例。这里，C2;113表示来自给定监测点s 13的第二监测目标的观测，监测源的类型为1。不同的观察用不同的颜色来描述Z. 妈，G.Mei，S.Cuomo等人沙特国王大学学报34392½22w¼B@........CAAw 2; 10·· ·w=2;S=2图三.说明了所提出的基于RBF的融合的过程。(a)在监测点s3和监测点s11中执行基于RBF的融合的示例。这些监测点从周围的邻居获得融合数据（b）获得用于监测点s11的融合数据的过程的更详细的图示，即，融合过程基于点与其相邻点之间的距离。（c）建立大小为S × K的融合矩阵。一对节点具有边E）。边的个数是S<$S-1<$= 2。利用加权邻接矩阵AwRS×S来描述节点之间的相似性，其被定义为等式（1）。（九）、在使用P个时间步长来预测接下来的Q个时间步长的数据基于向量v t，预测问题可以被定义为等式（1）。（十）、v^t1;.. . ;v^tQ¼argmaxlogP1;. . . ;vt Qjvt P1;. . . ;vt10矩阵，每个元素是每条边eij的权重wij，表示两个节点之间的空间相关性（即，监测点vt-si和sj）。利用高斯相似度函数，通过计算两个节点之间的距离来一在研究区域中有S个监测点，总共监测K个目标。则1/2vt-P1;·· ·;v t]2RP×S×K是融合矩阵更大的权重意味着两者之间更强的相关性前P个时间步长的FMv^预t1 ;·· ·;v^tQ ] 2RP×S×K预包含结w=i;j=exp.-disti;j2=r28K的预测结果步2.5. 第四步：数据建模下一个Q时间的监视目标00周1; 2周· · ·w1;S1B C.在本节中，我们将介绍STGCN的详细信息，9构建时空数据作为输入。首先介绍用于捕获空间相关表示的GCNw≤ S; 1 μ mw/S; 2/s··· 0其中disti;j表示监测点si和sj之间的距离，r是距离的标准差，定义了邻域的宽度（Von Luxburg，2007）。2.4.2. 时间相关数据的构建为了表示异构数据之间的时间相关性，我们构造了一个融合观测向量v t在时间步t的S个监测点中的R个S个，其中每个元素记录历史观测（即，来自监视目标的融合数据）用于监视点。具体地，框架V TRS×K表示融合矩阵在时间步长t处的当前状态。相应的信息存储在全连通图G中。一个典型的时间序列预测问题需要使用的数据来自于时间序列，从构建的图形结构数据中。其次，我们介绍了GCNN，它可以用来从构建的序列数据中捕获时间相关的表示。最后，我们介绍了STGCN，它融合了空间和时间表示来预测某些观测的未来趋势。2.5.1. 图卷积网络（GCN）在这里，我们将描述如何应用GCN从构造的图结构数据中捕获空间相关的表示。最近，GCN吸引了越来越多的关注;它们将传统卷积推广到具有非欧几里德结构的数据（Hammond等人，2011），因此非常适合从图结构数据中提取空间相关性。Z. 妈，G.Mei，S.Cuomo等人沙特国王大学学报3440S2见图4。一个示例说明了构建加权全连通图以表示整个研究区域中的所有监测点的过程。有13个监测点。将监测点表示为一个全连通图，然后利用高斯相似度计算图中节点（监测点）之间的相似度，从而得到一个加权邻接矩阵。图五、示出时间相关数据的示例在时间步t，来自整个研究区域中的所有监测点的所有监测目标的每个当前状态被记录在图形结构数据中。在结构上，通过对全连通图G的节点及其邻居的动作，GCN使得能够捕获节点与其周围的节点之间的空间相关性，以及对节点的属性进行编码（即，存储在每个节点处的不同信息）。有两种常见类型的用于执行图形卷积的方法，即，空间和光谱方法。本文采用的STGAN模型主要属于后一种类型。从理论上讲，谱图卷积法中，操作使用图形傅立叶变换来学习频谱域中的图形结构数据的空间相关表示。图卷积算子可以表示为ωG，其是图信号x2R与核H之间的乘法。傅立叶基URS×S作用于全连通图G的节点及其一阶邻居的节点，以捕获这些节点之间的空间相关性因此，GCN的卷积过程可以描述如下：图形信号x通过乘法核H进行滤波Z. 妈，G.Mei，S.Cuomo等人沙特国王大学学报34412ð Þωee ee e e ee2eeø2n不2W211L图六、GCN和GCNN模型的结构（a）图卷积网络（GCN）的架构（b）门控卷积网络（GCNN），1D-Conv表示1D卷积。在核 H 和图形傅里叶变换 UTx 之间（参见等式（ 11）和（12 ））（Shuman等人，2013年）的报告。GCN的结构如图所示。六、H ωGx <$HLx <$H。UKUTx¼UHUTx11L¼I-D-AD-沪公网安备31010502000112号在每个小区之间（即，时间步长），从而允许进一步捕获时间序列数据中不同观测值之间的关系。GCNN的结构如图所示。六、GCNN采用因果卷积作为时间卷积层，随后采用门控线性单元（GLU）作为非线性激活函数。这些时间卷积层使用残余连接。GLU确定哪些信息是其中L表示归一化拉普拉斯矩阵。U2RS×S是由L的特征向量组成的矩阵.表示单位矩阵。 D2RS×S表示对角度矩阵，其中Dii<$RjAw。KRS×S和滤波器HK都表示L的特征值的对角矩阵。堆叠多个图卷积层允许开发更深的架构，这有助于对图中的高阶邻域交互进行建模，并且因此可以捕获深度空间相关性（Duvenaud等人，2015年）。多层模型需要缩放和归一化。然后，图卷积进一步表示为等式（1）。（十三）、传递到下一个层次。通过使用非递归方法处理序列数据，时间卷积层易于并行计算，并改善了传统基于RNN的学习方法中存在的梯度爆炸问题。作为1D卷积层（1D-Conv），时间卷积层沿着时间维度进行卷积，滤波器大小为ft用于探索输入元素的Ft个对于构造的序列数据，时间卷积层在每个节点处的输入被认为是长度为P的序列。每个节点有K个通道，那么输入就是y2RP×K.因此，卷积涉及线性变换，Hx.1个D-1个A一次接收K个通道的连续数据，ωGh n2W21 113Þ输出通道。因此，输出的长度序列的长度小于输入的长度。考虑到过滤器1/4小时。D-2AwD-2MX-X其中h是核H的单个共享参数; A w和D被归一化为A w;A和D;A w^A w^I是具有自连接结构的矩阵，I是单位矩阵。D表示对角度矩阵，其中Dii<$RjAw。上述图卷积算子ωG主要适用于来绘制信号x2RS。对于具有K个通道的图形信号X 2 RS×K（这里K是指K个监视目标），G能够被扩展到多维张量，并且被定义为等式（1）。（十四）、X（即，卷积核）CRft×K×2Co，时间卷积，可以表示为Eq。（十五）、CωsyyωH1b1ryωH2b22RP-f t1×Co15其中H1、H2、b1和b2都是模型参数，H和b分别表示内核和偏差。ω表示卷积运算。是元素的乘积。r表示S形门，它决定了输入的哪些信息与时间序列数据的结构和动态演化有关。对于图G中的所有S节点采用相同的卷积核C，并且因此定义作为CωsY。Y2RP×S×K表示P个时间步长的融合矩阵其中L表示归一化拉普拉斯矩阵。K是输入尺寸，Co是输出尺寸。HRu×K×Co，其中u是图卷积的核大小。2.5.2. 门控卷积神经网络（GCNN）与传统的CNN相比，GCNN增加了一种特殊的门控机制，允许它用于从时间序列数据中捕获时间相关性。与RNN相比，RNN是一种基于复杂门控机制的传统时间序列分析模型，GCNN具有更简单的结构，这使其能够更快地响应动态变化，从而更快地进行训练并独立于先前的步骤（Dauphin等人， 2017年）。因此，GCNN能够获得空间（STGCN）STGCN是一种深度学习模型，包括多个时空卷积块（ST-Conv块）。STGCN被设计为处理图形结构的时间序列数据，以用于融合空间和时间表示并执行预测（Yu等人， 2018年）。图图7示出了包含两个时间门控卷积层的ST-Conv块的具体结构，并且空间图形卷积层作为连接被放置在它们之间。该设计减少了通道数K，从而减少了计算和速度中涉及的参数数起来的培训过程以序列数据½vt-P<$1;·· ·;v]2RP×S×K作为一组输入，vl2RP×S×K是输入KHωGxm¼k¼1Hk;mLxm2RS;16m6Co142.5.3. 时空图卷积网络Z. 妈，G.Mei，S.Cuomo等人沙特国王大学学报34422012-10此时，每个点的输出长度为P-f2001年。卷积-ð·Þω见图7。采用时空图卷积网络（STGCN）进行时空预测的建模过程。第l个ST-转换块。 v l1RP-2f t-1×S×Kl1是输出，可通过等式（1）获得。（十六）、vl1ClωsReLU.HlωG.Clωsvl16其中C1和C2分别表示从上到下的第1个Hl表示以下的核：首先，输入数据被馈送到GCNN层，并且1-D Conv处理监测点的时间信息。对于具有输入长度P的每个监测点，其K个输入通道沿着时间维度同时卷积。因此，不操作内核CRft×K×2Co GCNN将每个输入映射到其单独的输出。然后，GLU被用来激活它。在骗局之后-对具有通道2和长度P f1的数据求和，GLU生成器图卷积ReLU是整流线性单位函数。典型的STGCN堆叠两个ST-Conv块，并以生成长度为P-f的单个数据- tt1.一旦所有的数据额外的时间卷积和完全连接的层。这里，时间卷积层将最后一个ST-Conv块的输出映射到被视为输出层的全连接层。整个研究区域中所有监测点的预测结果均从该全连接层返回此外，STGCN根据其L2损失来衡量模型的性能，预测损失函数定义如下。已经被处理，每个节点（即，监测点）具有32个通道。接下来，从时间卷积得到的输入张量被馈送到GCN层。在每个时间步，其GCN层的输入由S个监测点和32个通道组成所有的监控点通过一个全连通图连接。对于单个监测点，连接到该点的其余S1个监测点被选为子集。图卷积Lv^;Whv^Xkvt-P1不;......的人。;vt;Wh-vt1kð17Þ操作者G通过重新加权相关数据来作用于监测点的子集。所选择的点和加权计算是基于图形结构数据来确定的。输入其中v^t·t是模型的预测，vt·t1表示地面实况。P是前P个时间步长。Wh表示可训练参数。详细的建模过程中所做的采用STGCN是说明图。8.第八条。在本文中，ST-Conv块中的三个层的通道被设置为32、8和32。每个时间步长的通道为32。GCN层中的输出通道数为8。ST-Conv块2内的卷积操作与上述过程相同通过连续卷积捕获构造数据之间的时空图8.第八条。使用时空图卷积网络（STGCN）建模的详细过程2Z. 妈，G.Mei，S.Cuomo等人沙特国王大学学报3443×最后，输出层（即，全连接层）执行最终预测，然后输出大小为S1的张量，即，S个监测点在单个时间步的预测值3. 结果：真实案例为了证明所提出的方法的有效性，我们将其应用到现实世界的异质数据，包括空气质量变量和气象变量来预测空气质量和分析结果。3.1. 数据融合在本节中，我们通过采用真实数据集来介绍异构数据融合。首先，我们详细描述了真实的数据集，并进行基于RBF的融合。其次，我们分析了数据融合输出的一致性，使用三个不同的指标。最后，我们使用五种机器学习算法来评估数据融合过程的有效性。3.1.1. 数据描述我们收集了2017年1月1日至2018年2月1日期间与北京空气质量相关的真实数据集，来自Har- vard Dataverse（Wang，2019）。该数据集由两类监测源组成：35个气象监测站，收集与气象条件相关的数据（例如，温度、湿度、风速等）以及17个收集与空气质量有关的数据的空气质量监测站（例如，各种污染物的浓度这些监测站分布在全市不同地区。每个监测站每小时都记录各种数据。因此，在该真实案例中从多个监测站收集的数据是典型的异构数据。我们使用了三个观察结果（即，温度、湿度和风速），以及一个观测值（即，PM2.5的浓度）。采用PM2.5浓度作为预测值。图13（a）示出了总共53个监测站的布局。我们以每小时为间隔汇总数据集。每个站点的每个观测包含8784条记录。在每个时间步t，我们采用所提出的基于径向基函数的数据融合方法。在清理数据后，我们利用线性插值法对连续三个小时的缺失值进行插补随后，将35个空气质量监测站和17个气象监测站的数据共4个监测目标融合成一个大小为53× 4的融合矩阵53表示监测站的总数，4表示监测目标的总数。3.1.2. 数据融合用三个指标分析了数据融合的一致性。首先，我们比较了原始数据和融合数据的方差。其次，我们比较了原始数据和融合数据的核函数的分布。第三，我们比较了原始数据和融合数据的时间序列分布不同的监测目标。首先，我们比较了原始数据和融合数据的方差，如图所示。9.第九条。融合数据的方差与原始数据的方差达到了令人满意的一致性这一结果意味着，所提出的基于径向基函数的融合方法，使异构数据，以实现类似的原始数据的数据分布。此外，对于一个观察（例如，PM2.5浓度），比较了融合数据与原始数据方差的时间分布。结果表明，趋势表现出令人满意的一致性。其次，我们比较了原始数据和融合数据的核密度估计，如图所示。10个。核密度估计是通过估计两批数据的概率密度来比较它们的分布的指标。原始数据和融合数据的密度分布似乎几乎是叠加的，进一步证明了融合数据的分布与原始数据的分布非常相似。第三，我们比较了原始数据和融合数据的时间序列分布不同的监测目标。原始数据和融合数据的时间序列分布如见图11。显然，四个监测目标的原始数据和融合数据保持了时间一致性。3.1.3. 数据融合为了进一步评估所提出的基于RBF的数据融合方法的有效性，我们随机选择了一个空气质量监测站，并通过执行五种集成机器学习算法，比较其基于原始数据和融合数据的预测。所使用的机器学习算法包括额外树回归器（ETR）（Geurts等人， 2006）、自适应提升决策树（ Ada-DT ）（ Drucker ， 1997 ）、随机森林（ RF ）（Breiman，2001）、梯度提升决策树（GBRT）（Friedman，2001）和极限梯度提升（Xgboost）（Chen和Guestrin，2016）。应该注意的是，我们的目的只是在原始数据和融合数据之间进行粗略比较，因此这些集成机器学习算法的估计器数量设置为200，默认值用于所有剩余的参数。在这里，使用附近气象监测站的数据作为特征直接获得原始数据预测见图9。原始数据和融合数据的方差。(a)所有观测值方差的比较。(b)方差的时间分布比较Z. 妈，G.Mei，S.Cuomo等人沙特国王大学学报3444G. ΣMAPE¼X。.P. v-v^t2不半]见图10。原始数据和融合数据的核函数估计。每个数据样本按照8：2的比例分成训练数据集和测试数据集。这五个模型的性能通过采用四个常用指标进行评估：（1）平均绝对误差（MAE），(2)平均绝对百分比误差（MAPE），（3）均方根误差（RMSE），和（4）R平方（R2）;见等式（18）对于MAE、MAPE和RMSE，较小的度量值指示下注。预测模型的性能对于R2，在0到1的范围内，较大的度量指示预测模型的较好性能上述五种集成机器学习算法的所有度量结果如表1和图2所示。 12个。1倍。.的数据融合方法开发的预测模型，从而证明。3.2. 基于图神经网络3.2.1. 空间和时间相关数据的构建数据构建包括（1）空间相关数据的构建和（2）时间相关数据的构建。对于空间相关的数据，为了构建加权全连通图，我们将53个监测站相互连接，以组装大小为53× 53，表示多个MAE¼gt1/2. vt-v^t。ð18Þ具有图形结构的监测站中的值该矩阵表示研究区域内监测站之间的相似性。A w的可视化如图11所示。 13RMSE为1的整数倍。ﬃﬃvﬃﬃﬃﬃﬃﬃ-ﬃﬃﬃﬃﬃv^ﬃﬃﬃﬃΣﬃﬃ2ﬃﬃGð19Þ（b），其中颜色越深，相关性越大。对于时间相关的数据，我们定义了数据区间每小时一因此，建造的规模序列数据为8784× 53× 4，其中8784为总长度100%v^t-vtgt¼1。vt.R21/4-Ptð20Þð21Þ在以小时为间隔的时间序列中，53个是分布在整个研究区域的监测站的总数，4个是所有监测源的监测目标的数量之和。构建的序列数据表示每个数据点随时间的变化此外，委员会认为，v-v^t2其中fv^tg和vt表示预测结果和地面实况，分别g表示所有预测值的总数如表1和图2所示。对于所有五种机器学习算法，所有融合数据都具有比原始数据更小的MAE，RMSE和MAPE值和更大的R2值。示在上述结果中，基于融合数据的预测模型每-比基于原始数据的预测模型明显更好地形成的有效性的数据来自建议的径向基函数-我们通过利用min–max 最后，60%的数据用于训练，20%用于验证，20%用于测试。3.2.2. 实验设置实验设置包括（1）实现和测试环境，（2）模型参数的确定，以及（3）用于性能评估目的的基线方法不gttZ. 妈，G.Mei，S.Cuomo等人沙特国王大学学报3445¼见图11。原始数据和融合数据的时间序列分布。表1在传统机器学习模型中使用融合数据和原始数据时的性能比较算法数据MaeRMSER2MAPEETR原始数据26.331201.100.0037百分之一百一十三融合数据23.741151.630.0947百分之一百零一Ada-DT原始数据29.251626.050.0034百分之一百零七融合数据28.531128.200.1131百分之九十RF原始数据24.371388.080.1513百分之一百一十六融合数据23.781122.560.2175百分之一百零四GBRT原始数据23.871259.660.0448百分之一百二十一融合数据23.551124.430.1161百分之一百零五XGBoost原始数据20.151005.760.1657百分之七十三融合数据19.77917.210.2790百分之七十二我们在PyTorch框架中实现了所提出的深度学习模型（Paszke等人，2017年）。该模型在配备Quadro P6000 GPU的工作站计算机上进行训练，该GPU具有24 GB GPU内存，Intel Xeon Gold 5118 CPU和128 GB RAM。以下是关于模型超参数设置的详细信息。GCN中的图卷积核的大小和GCNN中的时间卷积核的大小都是3。此外，我们添加了一个速率为0.3的dropout层。下一步是设置模型的训练参数。我们将学习率设置为0.001，批量大小为32，训练周期为350。在培训过程中，我们采用Adam优化器来最小化损失函数（Kingma和Ba，2015）。我们使用12 h作为历史时间步骤P，用于预测下一步的PM2.5浓度Q 3（即，3 h）。此外，我们采用了两个通用指标，也就是说，的MAE和RMSE，以评估模型的性能。在本文中，我们采用了其他三种深度学习方法作为基线：（1）LSTM，递归神经网络的变体（RNN ）（Hochreiter 和 Schmidhuber ， 1997 ） ;（ 2 ）GRU ，RNN的变体（Chung等人， 2014）;以及（3）T-GCN，一种将单个观测的空间和时间相关性融合到表现预测的模型（Zhao等人， 2020年）。此外，我们比较了基于不同数量的监测目标的STGCN模型的性能，表示为 STCGN-K1 ， STGCN-K2 ， STGCN-K3 和 STCGN-K4。K1是指利用预测目标（即，PM2.5浓度）作为输入。K2是指利用预测目标和一个采样观测作为输入。K3是指利用预测目标和两个采样观测作为输入。K4是指利用数据集中的所有观测值作为输入。3.2.3. 预测结果根据构建的数据，表

下载后可阅读完整内容，剩余1页未读，立即下载