基于多因子分析和多模型集成的海洋溶解氧浓度时间序列预测

135 浏览量更新于2024-01-22 收藏 2.68MB PDF 举报

人工智能研究

多因子分析

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

工程7（2021）1751研究人工智能-文章基于多因子分析和多模型集成的海洋溶解氧浓度时间序列预测刘辉，杨瑞，朱端，吴海平中南大学交通运输工程学院人工智能与机器人研究所，轨道交通安全教育部重点实验室，长沙410075阿提奇莱因福奥文章历史记录：收到2020年2020年7月25日修订2020年10月18日接受2021年3月19日网上发售保留字：溶解氧浓度预测时间序列多步预测经验小波分解多模型优化集成A B S T R A C T溶解氧（DO）是水产养殖的一项重要指标，对其进行准确的预测可以有效地提高水产品的品质。本文提出了一种新的溶解氧混合预测模型，它包括三个阶段：多因素分析、自适应分解和基于最优化的集成。首先，考虑到影响溶解氧的因素复杂，采用灰色关联度法筛选出与溶解氧关系最密切的环境因子。多因素的考虑使得模型融合更加有效。其次，利用经验小波变换（EWT）方法对溶解氧、水温、盐度和氧饱和度序列然后，五个基准模型被用来预测EWT分解的子序列。采用粒子群引力搜索算法（PSOGSA）计算这5个子预测模型的集成权重。最后，通过加权分配，得到了一个多因子DO集成所提出的模式的性能进行了验证的时间序列数据收集的太平洋岛屿海洋观测系统（PacIOOS）从WQB 04站在希洛。实验中涉及的评价指标包括实例分析表明：①该模型能获得较好的溶解氧预测结果;②该模型优于其他比较模型;③该预测模型可用于分析溶解氧的变化趋势，为管理者提供更好的管理决策。©2021 THE COUNTORS.Elsevier LTD代表中国工程院出版，高等教育出版社有限公司。这是一篇CC BY-NC-ND许可下的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）中找到。1. 介绍溶解氧（DO）是影响沿海城市水产养殖和海洋生态可持续发展。当今，随着工业的快速发展，大量的温室气体排放正日益加剧全球变暖[1]。结果，海水温度上升，DO从海水中逸出[2]。如果海水中的溶解氧浓度太低，鱼虾等海洋生物将被剥夺氧气，导致生长缓慢，甚至窒息[3]。对于近海养殖户来说，水产品的大规模死亡将带来巨大的经济损失[4]。更*通讯作者。电子邮件地址：csuliuhui@csu.edu.cn（H. Liu）.严重的是，溶解氧很难扩散到海洋深处，缺氧将迫使水生生物改变它们的栖息地[5]。海洋生态系统可能因此发生重大变化生态系统的良性循环一旦被打破，海洋生物的生存将受到极大的威胁[6]。准确的溶解氧含量预报对海洋生态平衡和沿海城市水产养殖业的发展是十分必要的它可以提供溶解氧未来变化的趋势分析，并通过使决策者能够提前采取有效措施来促进管理[7，8]。受营养盐、气候、生态环境、水生生物生命活动等因素的影响，海水中溶解氧含量具有非线性和较大的时滞。这种特性使得DO难以预测。此外，传感器获得的数据在传输过程中容易丢失，并且此类数据包含不确定的离群值，对预测的准确性提出了更多挑战[9]。https://doi.org/10.1016/j.eng.2020.10.0232095-8099/©2021 THE COMEORS.由爱思唯尔有限公司代表中国工程院和高等教育出版社有限公司出版。这是一篇基于CC BY-NC-ND许可证的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。可在ScienceDirect上获得目录列表工程杂志首页：www.elsevier.com/locate/engH.柳河，巴西-地杨，Z. Duan等人工程7（2021）175117521.1. 相关作品近年来，人工智能（AI）技术的兴起催生了一波AI模型。在此基础上，溶解氧预测模型可以分为两类：基于物理的模型和数据驱动的模型。数据驱动模型包括基于AI的模型和基于人工智能的模型。为了全面评估DO模型的最新成果，我们总结了基于数学的模型和基于AI的模型的文献。基于统计的模型在应用中具有计算简单的优点。此外，基于概率论的模型可以通过挖掘DO序列中的潜在关系来预测未知情况。在实际应用中，DO序列具有非线性和时滞的特点。Faruk[10]使用自回归综合移动平均（ARIMA）模型进行DO预测，以处理时间序列的不稳定性和非线性。在Li等人[11]的实验中，提出了灰色模型来预测DO的趋势项。Huan等人。[12]通过贝叶斯证据框架获得了模型Khan等人[13] 将新的贝叶斯回归模型与新的自回归修正模糊线性回归方法进行了比较。对比结果表明，基于模糊数的方法能较好地捕捉城市河流环境中溶解氧的变化。Khan等人[14]通过构建多元线性回归（MLR）模型预测DO浓度的变化，其中DO变化的不确定性得到有效表征和传播。在Kisi和Parmar[15]后来的研究中，MLR模型被用作实验比较，以探索其他预测模型的性能。总的来说，这些基于遗传算法的模型对溶解氧都取得了理想的预测效果。但是，预测的准确性还有待提高。与基于神经网络的模型相比，人工智能组件模型具有更好的预测性能。本节的核心重点是描述具有AI组件的模型。常用的AI算法包括多层感知器（MLP）[16]、径向基神经网络（RBNN）[17]、反向传播神经网络（BPNN）、极限学习机（ELM）[18]、最小二乘支持向量机（LSSVM）[19]和模糊神经网络（FNN）[20，21]等[22]。由于不同参数的选择对AI模型的性能有着巨大的影响，因此有必要通过以下方法来确定最佳参数：优化算法。Ren等人。[23]使用遗传算法（GA）优化FNN 的参数此外，粒子群优化（ PSO ） [24] ，柯西粒子群优化（CPSO）[25]，萤火虫算法（FFA）[26]和其他优化算法用于智能模型的参数选择[27]。随着深度学习技术的快速发展，其优秀的自适应能力得到了广泛的研究。Ma等人。[28]通过深度矩阵分解解决了稀疏矩阵的问题。 Ren等人。[29]使用深度简短网络（DBN）然而，由于DO变化的复杂规律和许多其他因素，简单的机器学习基本预测器和参数优化方法不足以实现精确的DO预测。为了进一步提高人工智能模型的预测性能，越来越多的学者将特征选择、分解和集成方法用于溶解氧预测的研究。关于这类研究的进一步详情包括：(1) 海洋和淡水中溶解氧浓度的变化水环境不是孤立的，因为它受到许多因素的影响，包括温度、浊度、pH值、叶绿素和电导率[30]。这些因素的变化对溶解氧浓度有着看不见的影响。为了有效地利用这些因素，需要研究具体的效果Shi等人[22]采用聚类方法对水质时间序列进行分段，最后改进了DO的预报精度Ren等人[23]通过相关分析，整理出与溶解氧正、负相关的因子结果发现，当将与DO密切相关的因素输入模型时，模型显示出更好的预测性能[31]。从溶解氧的产生和消耗的角度看，这些影响因素应有机地结合起来，而不应直接粗暴地输入到预测模型中。这不是一个全面的解释。多因子预报序列的直接叠加会降低模型的DO预报精度。需要分析各影响因素的权重分配，确定最优组合方法[32]。因此，探索溶解氧多因子分析预测方法具有重要的研究价值[33]。(2) 原始DO序列的非平稳特性不利于预报。DO系列的极端波动性分解法的诞生，很大程度上解决了这个问题。分解的子序列具有独立的振荡分量，并且更稳定，更容易预测[34，35]。为了将这一理论效果应用于实际问题，人们提出了许多AI模型的数据预处理分解方法广泛使用的分解算法包括集成经验模式分解（EEMD）[12]，离散小波变换（DWT）和变分模式分解（VMD）[36]。分解后的DO序列更具可预测性。然而，目前主流的分解方法需要用户根据经验来确定分解层这种做法不可避免地增加了人为错误[37]。为了提高预测模型的性能，需要研究一种能够自适应地确定分解层数的分解算法。(3) 经过多年的研究和发展，一些集成模型可以用于溶解氧的智能预报。集成模型可以结合多种预测模型的优点，以实现更好的预测性能[35]。通过Zhu等人[38]成功地解决了无法同时达到高、低浓度预报精度的问题。采用迭代逐步多元线性回归（ISMLR）对数据进行预处理.一个人工神经网络（ANN）和MLP运行分层预测。最后，用折衷规划（CP）对最优解进行评价和选择。Kisi等人。[39]提出了一种新的baidu模型平均（BMA）方法作为集合模型。通过与ELM、ANN、自适应神经模糊推理系统（ANFIS）、分类回归树（CART）和MLR的对比实验，发现BMA集成方法对溶解氧的预测是非常有效的。集合模式的实质是利用多种模式的优势互补，提高预报精度和模式应用范围。不幸的是，上述集成方法仅使用多个模型进行分层预测，然后简单地对结果进行排序。多个模型的直接集成将大大增加集成模型的复杂性，这很容易导致过拟合。与此同时，单一模式的不足是其他模式无法弥补的。因此，选择合理的模型组合是非常重要的。不同的机器学习预测模型具有各自的特点，可以应对不同状态下的时间序列。如果能将它们有机地结合起来，集成模型将具有互补的优势。适当的权重分配可以弥补基准模型的预测缺陷，增强基准模型的优势。因此，有必要探索多模型的科学集成方法。上述溶解氧预测模型已被验证-证明是有效的。尽管如此，科学研究仍存在空白H.柳河，巴西-地杨，Z. Duan等人工程7（2021）17511753为了进一步提高DO预测性能，需要填充。表1[10-1.2. 这项研究综合上述文献可以看出，在溶解氧预测研究中，多因子分析、自适应分解分析和科学集成分析的比较研究较少。针对上述局限性，本文提出了一种新的DO预测模型：MF-RNNs-EWT- BEGOE模型。MF代表建议的多因素分析法RNN代表复制器神经网络异常检测方法，EWT代表经验小波变换，BEGOE代表BFGS-ENN-GRNN-ORELM-ELM。该模型可分为多因素分析、自适应分解和基于优化的集成三个阶段。四个因素下的每个子层都使用同一类型的基准模型最后将结果组合得到模型的预测结果。在优化集成阶段，采用粒子群算法和引力搜索算法对Broyden-Fletcher-Goldfarb- Shanno（BFGS）模型、Elman神经网络（ENN）模型、广义回归神经网络（GRNN）模型、离群鲁棒极限学习机（ORELM）模型和ELM模型的集成权值表1综述了最先进的数据驱动溶解氧预测方法。类别研究内容参考出版年份贡献基于统计的模型ARIMA模型灰色模型[10个国家][第十一届]20102018本文将ARIMA方法应用于平稳和非平稳时间序列的研究提出用灰色模型预测贝叶斯模型[12个]2018做一个有效的证据框架被应用于获得[13个国家]2017最佳参数值新的贝叶斯回归模型MLR模型[14个]2013和新的自回归修正模糊线性回归方法在DO预测中的应用进行了比较MLR模型用于表征和传播[第十五条]2016DO变化MLR模型用于评估性能多模型，如LSSVM、多元自适应回归样条（MARS）和M5模型树（M5Tree）AI组件模型基本预测模型[21日][18个国家]20162020采用改进的模糊神经网络方法对低溶解氧事件进行ELM和MLP对日溶解氧的预报性能[17个]2012浓度比较采用基于人工神经网络的MLP和RBNN模型，[30个]2013与基于统计方法的MLR模型的比较人工神经网络、ANFIS和基因表达式编程（GEP）[16个]2014对溶解氧浓度的预测性能进行了比较将k-均值聚类方法与MLP方法相结合，[19个]2018提高模型的预测精度几种数据驱动的方法被用于建模，神经网络[23日]2018日溶解氧浓度预测的比较，如LSSVM，MARS和M5Tree采用遗传算法对中心点进行优化，[24日]2018FNN的宽度最后，通过实验确定了BP神经网络的最佳参数[27日]2019PSO算法提出了双尺度溶解氧软测量建模方法，[25日]2014用于提高预测性能采用粒子群优化算法对核参数进行优化[26日]2017以及LSSVR模型的正则化参数利用FFA对MLP深度学习方法[28]第二十八届2020采用深度矩阵分解法对溶解氧进行预测分解优化方法[29日][第四十届]20202019为了提高预测性能，提出了一种深度信念网络分解后的序列由样本算法集成方法[38个]2018熵（SE）方法，使预测更容易采用ISMLR + MLR + ANN进行分层预测高低浓度数据选择方法[39]第三十九届[22日]20202019通过与ELM、ANN、ANFIS、CART和MLR等多种模式的比较，验证采用基于分割的k[23日]2018选择要素采用相关分析进行特征选择分解方法[36个]2019采用小波变换和VMD对原始图像数据[12个]2018EEMD用于改善DO预测性能H.柳河，巴西-地杨，Z. Duan等人工程7（2021）17511754（PSOGSA）以获得BEGOE模型。第2节提供了拟议模型的详细信息。为了充分理解模型中每个部分的作用，我们进行了大量的对比实验。本研究的创新和贡献如下。(1) 设计了一个混合的三级海洋溶解氧预报集合该模型考虑了多因素分析，自适应分解分析和科学集成分析，从而填补了第1.1节中描述的三个研究空白。多因子分析合理地考虑了温度、盐度、浊度、叶绿素和氧饱和度等因素对溶解氧浓度的影响EWT分解用于自适应地提高时间序列的可预测性。降低了DO序列的非平稳性。采用PSOGSA优化方法对多个基准模型的权值进行优化。基准模型的补充进一步提高了混合模型的性能。这三个模块共同工作，以实现准确的预测溶解氧。(2) 合理地考虑了影响溶解氧浓度的几个因素多因素分析方法不仅考虑了单因素和多因素对模型精度的影响，而且考虑了多因素之间的相关性。这样可以得到融合性能较好的混合模型，避免了单一因素的片面影响和局部不利这种方法也弥补了直接多因素输入可能产生负面影响的该方法可以从多方面考虑DO浓度变化的原因。(3) 自适应数据预处理方法在分解效果方面取得了与主流的分解方法相比，自适应分解避免了人为选择分解层所带来的误差以这种方式，可以更容易地预测分解层此外，EWT分解方法丢弃分解模式的残差信号，提取有意义的海洋DO时间序列的信息EWT方法还在一定程度上补偿了某些分解算法对噪声和采样的敏感性数学理论的支持使机器学习算法的性能得到有效的发展。(4) 多个基准模型的有机结合填补了集成模型的研究空白。一个元启发式优化算法被用来分配权重BFGS，ENN，GRNN，ORELM，和ELM。集成方法可以实现多个基准模型的优点，同时减少单个模型的不利影响。集成模型解决了某些预测模型鲁棒性差的问题，充分体现了互补性的优越性因此，基于元启发式优化算法的多模型互补集成框架具有重要的应用价值。2. 多因素预测模型如前所述，所提出的MF-RNNs-EWT-BEGOE模型的建模过程可以分为三个阶段：多因子特征提取、EWT分解和多模型优化集成优化集成。图1显示了建模流程。值得一提的是，所提出的模型使用了多输入多输出策略（MIMOS），这是时间序列预测领域常用的策略[41]。与递归策略（RS）相比，MIMOS具有更小的累积误差[42]。图 2显示了RS和MIMOS的原理图。2.1. 第一阶段：多因素分析法2.1.1. 子阶段1.1：复制器神经网络离群值检测野值剔除是溶解氧数据处理的一个重要环节。预处理使数据看起来更有序，并且使预测模型更容易学习，而无需关注异常值的来源。值得注意的是，只有训练集Fig. 1.所提出的三阶段模型的建模流程。GR：灰色关联; GWO：灰狼优化器; BA：bat算法; MVO：多变量优化算法; WOA：鲸鱼优化算法; NBA：新蝙蝠算法。H.柳河，巴西-地杨，Z. Duan等人工程7（2021）17511755¼ ð ð Þ ð Þ ð Þ ð ÞÞ¼ ð ð Þð Þð Þð ÞÞ ðÞ联系我们ΣΣΣΣX1B半小时]qr;rk¼1我KK不Dp=0;Þe½（c）=Xy^t;D=1p用于确定与DO最相关的系列。GR度的具体计算方法如下[44，45]：设r01;r0 2;r0 3;：;r0n是一个级数群的系统特性行为，和Ri ri1;ri 2;ri 3;：：：;ri n 1iN是一系列相关的行为。<<因此，两个系列之间的相关系数可以通过以下计算方法获得akmini minkjr0k-rikjb maxi maxkjr0k-rik jr0k-rikjbmaximaxkjr0k-rikjð4Þ其中，R0k和R1k之间的绝对差是点k，mini minkjR0k-R1kj是两个层之间的最小差，maxi maxkjR0k-R1kj是两个层之间的最大绝对差，并且b（分辨率因子）通常是0.5。r0和ri的级数之间的关系q表示为：如下所示：Xn 阿斯克河图二.多步预测策略示意图。0In被纠正，而测试集保持不变。这是一种更有说服力的方式来验证模型的有效性。RNN用于检测原始海洋DO序列的异常值。这是一个多层前馈神经网络[43]。假设RNN的第k层中第i个神经元的输出是SkIki，Iki表示第k层中第i个神经元的输入，Sk表示第k层中使用的激活函数。神经元的输入可以表示如下：Lk-1hwkij Z k-1j12.2. 第二阶段：EWT分解法在多因子分析方法的基础上，利用EWT分解对溶解氧、水温、盐度和氧饱和度序列进行自适应分解对应于第s个预测器的标志是#s。图3显示了时间序列数据的分解方案。在训练阶段，分解总共执行X1s;：;X1247s;X1248s。X表示DO数据采样点。在预测阶段，将数据划分为成验证集X1249s;：;X1343s;X1344s和测试集j¼0其中Wkij是连接k层中的第i个神经元和k-1层中的第j个神经元的权重，Zkj是k层中的第j个神经元的输出，Lk是k层中的神经元的数量。在该示例中，当k= 2、4时，激活函数可以表示如下：Sð h Þ ¼tanhðahÞ 2019- 04- 2200：00：00X1345秒;：：：;X1439秒;X1440秒 . 验证集用于合奏模型优化，并利用测试集对模型进行性能测试。在此过程中，采用BFGS、ENN、GRNN、ORELM、ELM模型对子序列进行预测，可以得到第1249- 1440次序列的预测相位分解过程包括一步附录A中的算法S2显示EWT分解方法的伪代码。其中k被设置为1。对于k= 3的中间层，其激活函数可表示为类阶跃函数。激活函数可以表示如下：2.3. 第三阶段：多模型优化集成方法为了进一步提高预测性能，BFGS，ENN，1N-1- 是的j结合GRNN、ORELM和ELM得到BEGOE模型。S3小时24小时24小时第1页tanha3h-Nð3Þ集成权重由PSOGSA优化图 4示出了加权优化方案。优化目标其中，N表示步数，a3表示速率晋升到下一个级别。一般来说，进入第三层的连续数据通过RNN的S3这相当于映射系列sam-Ple toN clusters.最后，RNN可以计算单个离群值，PSOGSA的功能是最小化平均绝对百分比误差（MAPE）。MAPE是指不同样本的实际值和预测值之间的平均绝对百分比误差。在验证数据中计算目标函数。具体目标函数如下：一小群异常值这就完成了WQB 04站点的海洋数据。附录A中的算法S1显示了RNN离群值检测方法的伪代码对象min（PPEh.Ey^tD第1页E Y TE （P）P5 .X^ at;D×wað6Þ2.1.2. 子阶段1.2：多因素灰色关联分析（GR）度法为了筛选出对溶解氧预测最有利的因子，采用GR度法对原始因子进行特征选择，p0≤wa≤ 1其中Y t;ew1是在时间t的实际DO系列，具有噪声e和y t;D多因素系列在该示例中，GR度方法用于计算环境因子（诸如温度、盐度、浊度、叶绿素和氧饱和度）的相关性。时间序列之间的灰色关联度越大，两个序列之间的距离越近特征选择表示t时刻BEGOE的预测结果，其中B表示FGS的预测结果，ENN、GRNN、ORELM和ELM用样本D训练。Et;ED;和Ee表示对于具有噪声e的训练样本，随时间的期望。对于Ee，EeYt;e等于没有噪声的实际DO序列。然而，实际系列的噪音;ði¼1; 2; 3;:::;nÞð5Þ联系我们-]时间：H.柳河，巴西-地杨，Z. Duan等人工程7（2021）17511756ppppp半]p图三. EWT分解和逐层预测。图四、多因素分析下的PSOGSA优化集成过程不能消除，因为实际的DO系列不是人工系列。[2019 - 04 - 16][2019 -04][2019 - 04 - 16][2019 - 04][2019 - 04][2019 - 04 - 16][2019 -04][2019 - 04 - 04][2019 - 04][2019 - 04 - 04][2019 - 04][2019 -04][2019 - 04 - 04][2019 - 04][2019 - 04 - 05][2019 - 04][2019 -04][2019 - 04][2019 - 04]][2019 - 04][2019 - 04][2019 - 04][2019 -04]][2019 - 04][2019 - 04][2此外，P是预测的最大值步骤，第1周;第2周;第3周;第4周;第5周是的合奏重量和X^1;X^2;X^3;X^4;X^5;y^是p步预测结果H.柳河，巴西-地杨，Z. Duan等人工程7（2021）17511757BFGS、ENN、GRNN、ORELM、ELM和BEGOE的验证数据。考虑到在该示例中涉及DO 、水温、盐度和氧饱和度系列，BEGOE型号为四个系列，输出为DO系列。H.柳河，巴西-地杨，Z. Duan等人工程7（2021）17511758.BP.-×P.不c¼NSE1-t¼1tt.P.C.0P2B..-是的ΣΣ1P.C不不通过最小化目标函数MAPE，vut1。你知道吗？ﬃﬃﬃﬃﬃﬃﬃﬃﬃﬃﬃﬃﬃﬃcﬃﬃﬃﬃﬃΣﬃﬃﬃﬃΣﬃﬃﬃ2ﬃﬃ可以获得权重。水温，盐度，和氧饱和度添加到DO系列中。最后给出了BEGOE的预报结果算法S3的联系我们NYt¼1Y t-Y t-Yt-Ytð10Þ附录A给出了多模型优化集成方法的伪代码。3.试验与分析NYYt-Ytt¼1YtNY11在本节中，进行了多个对比实验，以验证所提出的模型的有效性。在第3.1节中，介绍了海洋监测系统收集的六个实时序列集在第3.2节中，展示了用于评估预测结果的性能在第3.3节中，解释了每个阶段的实现细节和贡献在第3.4节中，设置了两个实验。实验一横向比较模型组件的贡献，实验二比较几个国家的最先进的模型，以证明所提出的模型的优越性。3.1. 数据描述本节利用太平洋岛屿海洋观测系统从希洛WQB 04站收集的DO、温度、盐度、浊度、叶绿素和氧饱和度等时间序列数据进行实验研究。六个时间序列数据的时间间隔为15 min。为了有效地构建后续模型，将数据集分为三个部分：训练集，验证集和测试集。6个因子所对应的数据均选自1-2016年12月30日。其中，12月16-30日的数据被视为数据集#1，而12月1-15日的数据被视为数据集#2。对应于每个因子的每个序列的总长度为1440。训练集包含第1 - 1248个数据，验证集包含第1249 - 1344个数据，测试集包含第1345 - 1440个数据。附录A中的图S1和表S1显示了RNN离群值处理后的数据集信息。3.2. 绩效评价一个指标集用于评估确定性预测性能，包括决定系数（R2），Nash这五个指数的表达式如下：其中Y是预测结果，Y是实际数据，NY是实际数据的数量。3.3. 建模分析3.3.1. 多因素分析海洋中的溶解氧受多种因素的影响。本文分析了影响溶解氧浓度增减的各种因素。图5示出了系统动力学模型。如图5所示，许多因素影响DO浓度。通常，大气扩散、水交换、机械有氧运动、水生光合作用等是DO的主要来源。在自然条件下，海洋中溶解氧含量与空气中氧分压和水温密切相关。当溶解到水中的氧的速率等于从水中逸出的氧的速率时，溶解达到动态平衡。海洋中溶解氧的平衡还受盐度、浊度、pH值等因素的影响。此外，化学氧化反应、有机物分解、浮游植物夜间呼吸和水生呼吸作用是海洋溶解氧消耗的主要因素。总之，影响溶解氧含量变化的因素很多，其变化规律很难用简单的机理来解释本试验采用GR度法计算了温度、盐度、浊度、叶绿素、氧饱和度和溶解氧浓度具体结果见表2由表2可知，温度、盐度和氧饱和度与DO的相关程度最高相关性指标分别达到0.61、0.68和0.87，均超过设定阈值0.5。值得一提的是，盐度中含有营养盐，营养盐对溶解氧浓度起着重要作用考虑到高浓度的浊度会影响水体中植物的光合作用，影响水体中氧气的产生，将浊度作为DO相关因子输入模型实验采用多因素变量输入、单因素变量输出的形式在多次实际对比试验中发现，当温度、盐度、和氧饱和度作为影响因素输入到模型中，NYt1/2R2Yt-YtcYt-cYtC的因素。实验结果表明，当输入浊度、叶绿素、pH等低相关性因子时，1/4B@sX。ﬃﬃﬃﬃﬃﬃﬃﬃﬃﬃﬃﬃﬃﬃﬃﬃﬃﬃﬃ ﬃΣﬃﬃ ﬃ2ﬃﬃCAð7Þ预测精度也相应降低在NY Yt1/2-Y-2NYt1/2cYt -cYt在这种情况下，叶绿素指数始终保持在8.8 10-7 因此，它并没有显示出与溶解氧的变化，因此叶绿素NY YNY Yt1/2— Y-2— Y-2DO不是一个数字。3.3.2. 分解模型分析在本节中，EWT用于减少DO系列、水温系列、盐度系列，以及KGE¼1-qR-12a1 2b-12vuXﬃﬃﬃﬃﬃﬃﬃﬃﬃﬃﬃﬃﬃﬃ ﬃﬃﬃﬃﬃﬃΣﬃﬃﬃ2ﬃﬃ血氧饱和度系列，所有这些都是自适应decom-摆姿势值得一提的是，只有训练集数据是autNYt1/2cYt — cYtð9Þ腐烂了在原始DO系列和高度相关的序列被分解，子序列具有更稳定的特征。¼bYtYtPNYYt-Yt2特征更容易预测。主要的预测因素只是集中在-trates对一某些频率带内这些子系列。最终得到数据预处理后的最终结果通过叠加子预测器的预测结果。这联系我们t1/2ð8Þ不H.柳河，巴西-地杨，Z. Duan等人工程7（2021）17511759图五. 溶解氧变化的系统动力学模型图。表2WQB 04数据集中环境因子与溶解氧的相关系数。指示器相关系数温度盐度浊度叶绿素氧饱和度溶解氧0.610.680.32楠0.87答：不是一个数字。第二节通过对输入序列的分解，比较了预测模型的性能变化3.3.3. 优化方法分析在本节中，PSOGSA与多种替代方法进行了比较这些优化算法大多是基于仿生学的算法，从理论角度很难清楚地解释哪种算法因此，需要通过实验来验证各种优化算法在这种情况下的DO预测效果。3.4. 比较研究3.4.1. 实验一：与所提出的模型在实验一中，五个基线模型的基础上，所提出的模型的组成部分，并用于评估所提出的模型。表3列出了它们的具体表达式。为了验证与溶解氧有关的环境参数在实际计算中的影响，建立了多因素分析实验。模型1-3在没有多因素分析的情况下进行训练。在相同的情况下，模型4和5以及提出的模型增加了多因素分析。换句话说，模型4和5以及所提出的模型是用环境因素表3基线模型和拟议模型的实验设置模型实验设置模型1 RNNs-BFGS/ENN/GRNN/ORELM/ELM模型2 RNNs-BEGOEModel 3 RNNs-EWT-BEGOE型号4MF-RNN-BFGS/ENN/GRNN/ORELM/ELM型号5 MF-RNNs-BEGOE提出的模型MF-RNNs-EWT-BEGOE包括DO系列、温度系列、盐度系列和氧饱和度系列。为了比较优化集成的效果，建立了多模式集成比较实验。与模型1和模型4相比，模型2和模型5被优化并与五个基准模型组合。为了验证EWT分解方法的优越性，还进行了一组有无数据预处理的更具体地说，模型3和所提出的模型增加了EWT数据预处理模块，以减少原始序列的不稳定性。表4和表5列出了DO测试数据集预测结果。此外，为了体现优化算法的影响，在多模型优化集成模块中使用了第3.3.3节中描述的七种优化算法。图6示出了PSOGSA和其他优化算法的3步中的结论可从表4和表5中总结，图6如下所示：(1) 无论在数据集#1还是数据集#2中，模型2（RNNs-BEGOE）都明显优于模型1（RNNs-BFGS/ENN/GRNN/ORELM/ELM），这表明多模型集成方法是有效的。该方法结合了五种基准模型的优点。优化算法的多次迭代通过最优权值分配完成各个模型的组合。集成模型结合了每个基准模型的优点，同时丢弃了它们的负面性能。以数据集#1的一步预测结果为例，RNNs-BFGS、RNNs-ENN、RNNs-GRNN、RNNs-ORELM 、 RNNs-ELM 和 RNNs-BEGOE 的 MAPE 分别为 1.76% 、1.51%、2.74%、1.49%、1.61%和1.32%。其他评价指标如NSE、KGE、R2、R2等均表明模型2的预测性能优于模型1(2) 模型 3（ RNNs-EWT-BEGOE ）显著优于模型 2 （ RNNs-BEGOE），这表明基于分解的数据预处理方法对提高模型预测性能具有积极作用。EWT自适应地将原始序列分解成多个子序列。分解后的序列具有独立的振荡分量，稳定性强EWT具有强大的数学支持，H.柳河，巴西-地杨，Z. Duan等人工程7（2021）1751表17601760实验I中比较模型的评价指数（数据集#1）。Horizon型号NSE KGEMAPE（%）（mg·L-1）R2一步RNNs-BFGS0.47 0.691.760.16 0.50MF-RNNs-BFGS1.450.14 0.62RNNs-ENN 0.55 0.691.510.15 0.56MF-RNNs-ENN 0.62 0.751.410.14 0.63RNNs-GRNN-0.24 0.192.740.19 0.35MF-RNN-GRNN0.52 0.561.630.15 0.53RNNs-ORELM1.490.14 0.62MF-RNNs-ORELM1.410.14 0.63RNNs-ELM1.610.15 0.55MF-RNNs-ELM1.440.14 0.61RNNs-BEGOE0.70 0.751.320.10 0.83MF-RNNs-BEGOE0.91 0.900.670.07 0.91RNNs-EWT-BEGOE0.97 0.960.380.04 0.97MF-RNNs-EWT-BEGOE1.00 1.000.110.01 1.002步RNNs-BFGS0.28 0.572.000.19 0.36MF-RNNs-BFGS1.780.17 0.47RNNs-ENN 0.38 0.591.750.17 0.41MF-RNNs-ENN 0.47 0.631.720.16 0.48RNNs-GRNN-0.33 0.152.840.20 0.28MF-RNN-GRNN0.32 0.411.990.18 0.33RNNs-ORELM1.910.17 0.48MF-RNNs-ORELM1.760.16 0.48RNNs-ELM 0.39 0.581.850.17 0.41MF-RNN-ELM 0.46 0.651.720.16 0.48RNNs-BEGOE0.53 0.651.690.13 0.68MF-RNNs-BEGOE0.81 0.821.030.09 0.82RNNs-EWT-BEGOE0.92 0.920.670.06 0.92MF-RNNs-EWT-BEGOE0.99 0.990.140.02 1.00三步RNNs-BFGS0.02 0.462.280.22 0.22MF-RNNs-BFGS0.24 0.542.060.19 0.32RNNs-ENN 0.23 0.471.990.19 0.29MF-RNNs-ENN 0.29 0.511.990.19 0.33RNNs-GRNN-0.41 0.112.920.20 0.23MF-RNN-GRNN0.21 0.342.150.19 0.24RNNs-ORELM2.310.19 0.33MF-RNNs-ORELM2.040.19 0.33RNNs-ELM 0.22 0.462.120.20 0.27MF-RNNs-ELM 0.27 0.531.990.19 0.33RNNs-BEGOE0.47 0.601.800.14 0.64MF-RNNs-BEGOE0.71 0.761.240.11 0.75RNNs-EWT-BEGOE0.80 0.881.070.10 0.80MF-RNNs-EWT-BEGOE0.98 0.980.170.04 0.99消除了不同子系列之间的相互作用。这些优点的结合使EWT成为数据预处理的一个很好的候选者。以数据集#1的一步预测结果为例，模型2的NSE，KGE，MAPE，R2分别为0.70，0.75，1.32%，0.10mg·mL-1和0.83，模型2的 NSE，KGE，MAPE，R2分别为0.97，0.96，0.38%，0.04 mg·L-1，模型3为0.97。(3) 模型4（MF-RNNs-BFGS/ENN/GRNN/ORELM/ELM）和模型5（MF-RNNs-BEGOE）以及所提出的多因素分析模型与相应的未进行多因素分析的模型1-3相比表现出显著的更好这项工作表明，环境因素，如温度，盐度和氧饱和度对溶解氧浓度有影响。它们之间存在着复杂的非线性关系，单一的溶解氧因子的考虑是不全面的。以数据集#1的一步预测结果为例，模型2的NSE、KGE、MAPE、NES和R2分别为0.70、0.75、1.32%、0.10 mg·mL-1和0.83，模型5的NSE、KGE、MAPE、NES和R2分别为0.91、0.90、0.67%、0.07 mg·mL-1实验结果表明，多因素考虑是正确的。当多种因素合理地输入到预测模型中时，可以得到更准确、更科学的预测结果。(4) 综合考虑所有的实验数据集、预测步骤和不同的模型评价指标，所提出的混合模型具有最突出的预测性能。该模型具有良好的鲁棒性和准确性，其预测结果与实际DO值非常接近。以数据集#1的一步预测结果为例，所建模型的NSE、KGE、MAPE、KES和 R2 分别为1.00、1.00、0.11%、0.01mg·mL-1以数据集#2的一步预测结果为例，所建模型的NSE，KGE，MAPE，R2分别为1.00，0.98，0.18%，0.01mg·L-1和1.00 mg·L-1。两组实验均表明，该模型具有良好的耐久性。总之，多因素分析，自适应分解分析，科学的集成模型分析是必不可少的，以提高所提出的混合模型的性能。混合模型框架具有较强的可解释性，为溶解氧预测的改进提供了方向。3.4.2. 实验二：与现有模型的近年来，已经提出了许多基于AI的DO预测模型在实验II中，我们复制了2018-2020年发表的三个最这些模型相对复杂，基本的机器学习模型也能达到令人满意的效果。为了完成合理科学的模型评估，我们添加了基于ANN的支持向量机（SVM）模型和基于深度学习的DBN模型进行比较。具体型号介绍如下：H.柳河，巴西-地杨，Z. Duan等人工程7（2021）17511761表5实验I中比较模型的评价指数（数据集#2）。MF-RNN-GRNN0.18 0.54 2.71 0.22 0.31Li等人[31]分别使用递归神经网络、长短期记忆网络（LSTM）和门递归单元（GRU）构建了三个DO预测模型，以确定最合适的一个。在实验中，计算pH、浊度、温度、氨氮和溶解氧之间的相关系数，然后将这些序列统一输入预测模型。与Li直接输入所有参数相比，我们通过设置阈值和实验筛选的方法，最终确定能够对做预测。李的方法有降低准确性的风险。实际上，各影响因子的相关系数只能作为一个参考指标，而这些环境因子与DO之间的真实关系是非常复杂的。Huan等人。[12]将EEMD数据预处理方法和LSSVM相结合，以提高模型首先利用EEMD对DO序列进行分解，然后利用LSSVM分别通过叠

下载后可阅读完整内容，剩余1页未读，立即下载