没有合适的资源?快使用搜索试试~ 我知道了~
工程6(2020)944研究智能环境预测-文章基于多特征聚类和神经网络的PM2.5小时浓度预测模型及其在中国的应用刘辉,龙志豪,朱端,石辉鹏中南大学交通运输工程学院人工智能与机器人研究所,轨道交通安全教育部重点实验室,长沙410075阿提奇莱因福奥文章历史记录:收到2019年2020年2月14日修订2020年5月25日接受在线预订2020年保留字:PM2.5浓度预测A B S T R A C T空气动力学直径不大于2.5lm的颗粒物(PM2.5)浓度预报是空气污染预警的理想预报对象。本文提出了一种改进的混合模型--多特征聚类分解(MCD)(PSO),用于多步PM2.5浓度预测。该模型包括分解和优化预测组件。在分解部分,MCD方法包括粗糙集属性约简(RSAR),k-均值聚类(KC),和经验小波变换(EWT)的特征选择和数据分类。在MCD中,RSAR算法是选取重要的空气污染物变量,然后用KC算法进行聚类的PM2.5浓度聚类经验小波变换PM聚类结果2.5 EWT将浓度序列分解为若干子层多步预测算法在优化预测模块中,对每个分解后的模型子层完成多步预测计算。利用粒子群优化算法对ESN预测器的初始参数进行优化。利用我国不同区域4个城市的PM2.5浓度实测数据验证了模型的有效性。实验结果表明,该预测模型适用于PM2.5浓度的多步高精度预测,其性能优于基准模型。©2020 THE COUNTORS.由爱思唯尔有限公司代表中国工程院和高等教育出版社有限公司出版。 这是一篇CCBY-NC-ND许可(http://creativecommons.org/licenses/by-nc-nd/4.0/)。1. 介绍随着发展中国家和地区城市工业的发展,空气污染已成为世界各国普遍关注的难题。近年来,我国大部分地区出现雾霾天气,空气质量已成为国家战略问题。空气中的颗粒物动力学直径不大于2.5lm(P M2. (5)含有大量有毒有害物质的数量[1]。PM2.5最多常见的空气污染物,对人体健康和空气质量有负面影响[2]。已有研究表明,PM2.5污染对呼吸系统和心血管系统有直接影响,并与肺癌的发病率和死亡率密切相关[3]。此外,PM2.5对天气气候也有不好的影响。例如,PM2.5可能导致异常降雨,加剧温室效应[4*通讯作者。电子邮件地址:csuliuhui@csu.edu.cn(H. Liu).鉴于PM2.5对人们PM2.5浓度预测被认为是缓解PM2.5负面影响的重要而有效的方法[8]。这种方法对于城市大数据在智慧城市发展中的应用也很重要[9]。1.1. 相关作品PM2.5浓度预测方法可分为四类:物理模型、统计模型、人工智能模型和混合模型。物理模型侧重于理解气象和化学因素的潜在复杂排放、传输和转化过程[10]。物理方法产生准确的预测结果。然而,物理模型需要足够的空气污染排放信息[11],并且其计算成本很高[12]。统计模型克服了物理方法的缺点,因为它们需要简单的样本并且具有快速的计算速度[13]。然而,统计模型不https://doi.org/10.1016/j.eng.2020.05.0092095-8099/©2020 THE COMEORS.由爱思唯尔有限公司代表中国工程院和高等教育出版社有限公司出版。这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表工程杂志主页:www.elsevier.com/locate/engH. Liu等人/工程6(2020)944945充分考虑各种影响因素之间的协方差,因为它们通常基于有限的样本。单个表1近四年来PM2. 5人工智能模型可以描述非线性的规律,系统在处理大数据方面具有很大的优势[14]。参考特征选择分解预测器然而,这种模型的缺点在于神经网络的计算成本,其大于统计模型的计算成本。而且,神经网络的训练过程具有一定的波动性,因此其输出可能不是最优结果[15]。鉴于上述方法的局限性,混合模型在大气污染预测中得到了广泛的应用混合模型通常由三部分组成:数据预处理、特征选择和预测器.数据预处理可以理清原始数据中复杂的数据关系,使其更加稳定。特征选择可以改善输入数据的结构,降低维数过高给模型训练带来的困难。混合模型可以综合各算法的优点,以达到更好的模型性能。许多相关工作表明,混合模型往往具有更好的预测性能[16表1[16-特征选择在表1所列的当前混合PM2.5浓度预测模型中很少使用。但是,如果一个PM2. 5浓度预测模型的输入包括很多特征,如PM2. 5、PM10、二氧化硫(SO2)、臭氧(O3)等,可能会给PM2. 5浓度预测模型训练带来困难,增加训练时间。这也影响了PM2.5浓度预测模型的稳健性[29]。同时,复杂的输入数据可能导致模型的过拟合,并可能降低模型的准确性[30]。目前常用的特征选择算法有主成分分析(PCA)、相空间重构(PSR)和梯度提升回归树(GBRT)。然而,这些方法可能是不适合的空气污染物浓度序列,因为他们假设一个线性系统,这可能会导致问题,如不能实现全球最佳的减少。基于模糊理论的粗糙集属性约简(RSAR)算法具有停止准则明确、无参数等优点[31]。RSAR通过属性间的依赖关系得到目标属性的重要属性集RSAR算法是一个热门的研究课题[32]。聚类算法通常用于数据挖掘和分析[33]。存在各种聚类方法,例如k均值聚类(KC)[34]、可能性c均值(PCM)[35]、治愈聚类[36]等。与其他聚类算法相比,KC算法具有原理简单、计算速度快、聚类效果好等优点,是目前应用最广泛的聚类算法将RSAR算法与KC算法相结合,使得RSAR算法为KC算法提供合理的聚类对象成为可能,是一种有价值的方法研究点。分解主要集中在表1中的小波理论方法。分解算法可以将原始数据按照不同的时间尺度划分与经验模式分解(EMD)、总体经验模式分解(EEMD)和复经验模式分解(CEMD)相比,经验小波变换(EWT)算法可以自适应地划分傅立叶频谱并选择适当的小波滤波器组[37]。聚类方法也可用于PM2.5浓度预报领域的分解.聚类算法可以根据不同的大气污染情景对原始数据进行分类。通过聚类可以减少样本多样性对模型训练的影响然而,很少有研究使用[16]无CEEMD SVR由GWO[21]无无CAMS[22]无EMD LS-SVR[23]CSO优化的LS-SVR[24]无无WRF-Chem[25]通过CPSOGA优化的CEEMD[26]通过GWO优化的无VMD[17]通过CPSO-GA优化 PSR WPD和CEEMD[20]GBRT WPD MLP通过LPBoost[27]粒子群优化的无WPD[28]无无NAQPMS[18]无小波神经网络与支持向量机[19]WD和VMD LSTMPCA:主成分分析; PSR:相空间重构; GBRT:梯度提升回归树; CEEMD:完全集成经验模式分解; EMD:经验模式分解; VMD:变分模式分解; WPD:小波包分解; WT:小波变换; WD:小波分解; SVR:支持向量回归; GWO:灰狼优化; CAMS:哥白尼大气监测服务; LS-SVR:最小二乘支持向量回归; CSO:布谷鸟搜索优化; WRF-Chem:化学天气研究和预报模型; CPSO-GA:结合粒子群优化和遗传算法; MLP:多层感知器;LPBoost:线性规划助推; BPNN:反向传播神经网络; NAQPMS:嵌套空气质量预测模型系统; ANN:人工神经网络; SVM:支持向量机; LSTM:长短期记忆网络提出了一种基于聚类算法和分解算法的混合PM2.5浓度预测方法。表1中所示的预测器是常用的物理方法、机器学习和人工神经网络(ANN)。虽然哥白尼大气监测服务(CAMS)、天气研究和预报模式与化学(WRF- Chem)和嵌套空气质量预测模式系统(NAQPMS)有准确的预测结果,但它们需要复杂的数据和对各种物理和化学关系的理解。因此,这些方法需要大量的准备工作和高水平的专业知识。支持向量机(SVM)、支持向量回归(SVR)和最小二乘支持向量回归(LS-SVR)对参数的选择要求很高,不能处理大数据问题。传统的神经网络,如反向传播神经网络(BPNN)和进化神经网络(ENN)需要大量的训练来建立复杂的神经关系,并且容易过拟合。回声状态网络(ESN)具有独特的水库结构,由循环连接的单元。因此,ESN的训练过程简单有效,适用于PM2.5浓度数据等非线性系统[38]。ESN已用于其他领域,如风速预测[38]。因此,将ESN模型应用于混合PM2.5浓度预测是非常合适的.1.2. 本研究综合上述文献,基于分解的聚类算法、非线性模糊理论算法和ESN在PM2.5浓度预测中的研究较少本研究旨在将这些算法应用于混合PM2.5浓度预测。提出的混合PM2.5预测模型结合了三种方法:多特征聚类分解(MCD),ESN和粒子群优化(PSO)。MCD中采用RSAR算法选取大气污染物重要浓度。然后利用KC算法根据RSAR算法的结果将原始PM2. 5浓度数据分成若干组的聚类结果946H. Liu等人/工程6(2020)944-.ΣΣ.ΣΣ>联系我们cospb12sxn1利用EWT算法将PM2.5浓度序列自动分解为若干子层对每个聚类组中的每个分解子层建立一个基于ESN的然后将每个子层的预测结果进一步积分,形成最终的预测值。利用粒子群优化算法对ESN预测器的初始参数进行优化。 实验结果表明,该混合模型能够准确预测PM2.5小时平均浓度第2节解释了拟议模型的细节。2. 方法2.1. 拟议模式混合MCD-ESN-PSO模型的构建过程A部分:MCD这一部分包括RSAR、KC和EWT算法。采用RSAR算法对原始空气质量数据进行滤波,滤波后的属性数据采用KC算法进行聚类。通过该步骤将原始数据划分为几个聚类。然后利用EWT算法对聚类后的数据进行子层分解。最后,利用子层建立不同的ESN模型。通过MCD方法,RSAR算法和KC算法可以共同作用于原始数据,实现特征的聚类。通过EWT算法的分解处理,最终将原始时间序列分解为多个和更好的子层。RSAR、KC和EWT算法的细节SU;V;A;h 3其中U是对象的有限非空集; V是值的非空集; A是属性的有限非空集; h是将U中的对象映射到V中的一个值的信息函数。在本研究中,A是所有属性的集合,例如A={PM10,CO,SO2、NO2、O3、PM2. 5},V为它们的值。f是用于获得c的相关性函数,c是在RSAR过程中计算的集合的相关性。约简应该保持排序(c)的质量,定义条件属性集CA和属性集PCA。一些-有时,一个信息表可能有多个约简,所有约简的交集称为决策表的2.3. k-均值聚类KC是一种简单的迭代聚类算法,使用距离作为相似性指标[34]。它的最终目的是在一组给定的数据集中找到k个聚类。每个类的中心是根据所有类的值,其中每个类由聚类中心描述。KC算法的过程如下:(1) 选择数据空间中的第k个对象作为初始中心;每个对象代表一个聚类中心。(2) 将样本中的数据对象按照最近的聚类中心划分为相应的类,根据它们与这些聚类中心之间的欧几里德距离。vuXD。ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiΣffiffiffi2ffi在2.2 -2.4节中分别介绍了这些算法B部分:ESN距离xi;xjtd1xi;d-xj;dð4ÞESN是一种基本的预测器,它对分解后的PM2.5浓度数据进行预测.ESN由输入层、储备池和输出层组成ESN的主要思想是使用储备池来模拟一个复杂的动态空间,该空间可以随输入而变化。参考Ref。[38]中,ESN的更新方程和输出状态方程可以表示为方程:(1)和(2):xt1yt1ffWout×½ut1;xt1]g2其中x是从储备池到输出层的输入数据;y是输出;t是时间;u是从输入层到储备池的输入数据;f是ESN的函数;W_in表示x(t-1)到x(t)的连接权重;u(t+ 1)是输入数据;W_back表示输入层到储备池的连接权重;W_out表示y(t-1)到x(t)的连接权重。C部分:PSO与传统的ESN模型不同,其中xi是第j个聚类中的第i个样本;Xj是第j个聚类的中心;并且D表示数据对象的属性的数量。(3) 更新聚类中心:取每个类中所有对象的均值作为聚类中心,计算目标函数的值。(4) 判断聚类中心和目标函数的值是否如果它们相等,则输出结果;否则,返回步骤(2)。2.4. 经验小波变换本文采用EWT算法进行数据预处理。Gilles[37]提出的EWT是一种自适应地构造小波的新型信号处理技术。EWT基于小波变换的理论框架,克服了EMD理论的不足和信号混叠问题。EWT自适应地划分傅立叶谱,选择合适的小波滤波器组。经验尺度函数和经验小波可以表示为方程:(5)和(6)分别:本文结合粒子群算法。在ESN-PSO中算法、ESN模型的相关参数输入等尺度、光谱半径、内部单元数和连通性,8比<1。n2如果jxj≤<$1-s<$xn2sxn1/2jxj-11-sxn]如果1-sxn≤ jxj≤1sxn用PSO算法优化。最后将各子层的预测结果与原子层的预测结果进行合并。预测结果>:0其他智慧ð5Þ将每个子层的预测结果相加,以获得最终的预测结果。2.2. 粗糙集属性约简8比1。W^ X2if<$1<$s <$xn≤jxj≤<$1-s<$xn<$1cospb1<1/2jxj-11-s11xn11]如果1-sxn1≤jxj≤1sxn1RSAR可以用来删除无用的信息,而主要-n Þ¼>sin. P湾1½jxj-1-sxn]如果1-sxn≤jxj≤1sxn保持现有信息排序的质量[31]。所获得的信息被称为“约简”。在一份报告中-:0,否则ð6Þ在一个系统中,一组对象由一组属性描述[31]。知识信息系统的定义如下:其中n是被分割的区间;x是频率;b是区间[0,1]中满足阶导数的任何函数,s是频率>22sxnH. Liu等人/工程6(2020)944947系数;b(x)=x4(35-84 x+70x2-20x3)和s
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功