数据融合与机器学习提高环境监测网络低成本传感器数据质量的研究

177 浏览量更新于2023-12-10 收藏 1.02MB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

⃝可在www.sciencedirect.com在线获取ScienceDirectICTExpress 6（2020）220www.elsevier.com/locate/icte使用数据融合和机器学习方法提高环境监测网络恩瓦马卡大学放大图片作者：J.德莱尼aa爱尔兰都柏林大学电气和电子工程学院加拿大安大略湖首大学电气工程系接收日期：2020年2月28日;接收日期：2020年6月9日;接受日期：2020年6月22日2020年7月3日在线发布摘要由于全球气候变化危机的加剧，环境监测已成为一个活跃的研究领域。然而，目前的环境监测解决方案的特点是购置成本高和安装复杂;往往需要大量的资源、基础设施和专业知识。用这些解决方案来实现高密度的原位网络是不可行的，例如需要建立精细的尺度模型以促进稳健的监测，因此，在收集的数据集中留下了很大的差距。低成本传感器（LCS）可以提供高分辨率的时空测量，可以用来补充现有的数据集从当前的环境监测解决方案。然而，LCS需要频繁校准，以便提供准确可靠的数据，因为它们经常受到影响在野外部署时受到环境条件的影响。校准LCS有助于提高数据质量，并确保他们收集的数据准确无误。然而，实现有效的校准需要识别影响给定测量的传感器数据质量的因素。该研究评估了三种特征选择（FS）算法的性能，包括前向特征选择（FFS），后向消除（BE）和穷举特征选择（EFS），以识别影响环境监测网络中低成本物联网传感器数据质量的因素。应用数据融合的概念，将传感器数据与环境因子融合成单一的标定方程，利用线性回归（LR）和人工神经网络（ANN）对CairclipO3/NO2和CairclipNO2传感器进行标定。该研究表明了校准在提高低成本物联网传感器数据质量方面的有效性，并证明了特征选择的便利性和数据融合为校准模型提供更一致，准确和可靠信息的能力。分析表明，cairclipO3/NO2传感器提供的测量值与参考测量值具有良好的相关性，而cairclipNO2传感器显示与参考数据没有合理的相关性。校准CairclipO3/NO2产生良好的与参考测量值相比，其测量输出得到改善（R2=0.83）。然而，校准cairclipNO2传感器数据质量没有显著提高c2020年韩国通信与信息科学研究所（KICS）。出版社：Elsevier B.V.这是一篇基于CC BY-NC-ND许可证的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。关键词：物联网;机器学习;数据融合;特征选择;环境监测1. 介绍传感器网络和物联网（IoT）技术的进步开创了环境监测的新纪元[1，2]，促进了高分辨率时空数据集的收集，填补了∗ 通讯作者。电子邮件地址：nwamaka. ucdconnect.ie（N.U.）Okafor），yahia.alghorani@ ieee.org（Y.Alghorani），declan. ucd.ie（D. T. Delaney）。同行评审由韩国通信和信息科学研究所（KICS）负责https://doi.org/10.1016/j.icte.2020.06.004当前数据集[3]。虽然物联网技术提供了扩展环境监测当前能力的可行工具[4]，但引入低成本传感器（LCS）对于扩大范围和采用范围至关重要[5]。然而，LCS在环境监测中的应用引起了一些关注，特别是与其准确性，可靠性，现场适用性和性能有关。LCS对化合物或感兴趣的变量不太精确和不太敏感，因为它们的响应在很大程度上受到气体传感器的交叉灵敏度、颗粒物传感器的颗粒特性或两种情况下的环境因素的影响[6]，当用于替代或补充现有的监测解决方案时，需要进行权衡。2405-9595/2020韩国通信和信息科学研究所（KICS）。出版社：Elsevier B.V.这是一个开放的访问CC BY-NC-ND许可证下的文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。不适用Okafor，Y.Alghorani和D.T.Delaney/ICT Express 6（2020）220221校准LCS可以帮助提高数据质量和现场性能，并确保他们收集准确的值[7]。物联网传感器的制造商通常在将传感器投放市场之前对其进行校准，然而，校准通常是在受控的实验室条件下进行的，这并不代表传感器在现场部署时所面临的确切条件。因此，即使在实验室中校准后，传感器也可能继续在现场报告不准确的值。建议将自动/现场传感器校准作为减少这些挑战的一种手段[8]。机器学习（ML）技术可用于根据影响环境因素在现场校准LCS[9为了有效地做到这一点，必须确定影响给定传感器测量的数据质量的因素模拟这些因素对传感器响应的影响，• 应用该模型校正传感器输出误差在本文中，我们研究了三种特征选择算法的性能，用于选择适合于在环境监测网络中建立精确的LCS校准模型的最佳特征子集。我们应用统计数据融合技术，合并和集成选定的功能到校准模型，使用线性回归和神经网络技术。利用所建立的模型对CairclipO3/NO2和CairclipNO2传感器进行了标定，并对标定结果进行了比较。虽然这些模型是为环境监测网络中的LCS校准而设计的，但这些工具和技术可以应用于其他领域的传感器校准。本文的贡献包括：(i) 比较前向特征选择（FFS）、后向消除（BE）和穷举特征选择（EFS）方法在确定影响环境监测网络中物联网传感器数据质量的因素方面的性能。(ii) 开发基于误差建模和传感器数据融合的流程，用于低成本物联网传感器的现场校准。(iii) 为环境监测系统中LCS的纠错和数据质量的提高提供了可靠的技术。本文的其余部分结构如下，第2节详细介绍了基于物联网的环境监测的最新技术水平。第3节介绍了这项工作的动机，第4节描述了本研究中使用的数据集第5节涉及传感器校准的误差建模，概述了LCS中的特征选择、数据融合和数据质量改进的技术。结果和性能评价见第6节，第7节为结论。2. 现有技术在基于物联网的环境监测系统领域已经进行了几项研究，并显示出显著的好处。Syafrudin等人Manes et al.利用LCS研究实际场地的环境条件[12，13]。他们的研究结果证明了传感器在提供实时环境数据方面的实用性和有效性虽然物联网传感器可以提供高分辨率的时空数据集，但这可能会受到短时间的限制，因为低成本传感器在长期监测中的应用有限[14]。目前的研究还表明，物联网传感器对环境条件敏感[15]。校准LCS可以帮助解决这些问题，提高传感器的数据质量，并确保它们收集准确的值。简单线性回归（SLR）方法已被建议用于校准物联网传感器。Badura等人建议使用该方法校准PMS7003颗粒物（PM2.5）传感器[16]。尽管这种方法足以将原始传感器输出与参考测量值相关联，但它无法捕获传感器测量值相对于环境条件的时间变化。为了克服这一缺点，他们在拟合中应用了多元线性回归（MLR将传感器的数据与参考测量值进行比较，包括环境参数;校准方程中的温度（T）和相对湿度（RH）。他们的工作确立了高RH对传感器输出的影响，并表明T与RH具有中等相关性多参数回归模型和监督机器学习方法已被应用于校准传感器设备。Munir等人在[17]中开发了MLR模型和广义加性模型（GAM），用于校准Environ手表E-MOTES，以捕获一年期内与参考监测器搭配的一氧化氮（NO）和二氧化氮（NO2）浓度。他们的加性模型适用于正态和非正态数据分布，并且不假设因变量（参考数据）与解释变量之间存在线性关系。尽管评估模型的各种拟合优度指标显示模型结果与参考测量结果具有良好的一致性，但是，由于缺乏使用类似传感器的大量工作，因此无法对该模型进行定性评估，特别是与先前研究的结果相比。Yamamoto等人提出，使用人工神经网络（ANN）校准温度传感器的基于机器学习的方法[18]。他们的研究基于一年的数据集，该数据集使用测量空气温度和相对湿度的SHT-71传感器从日本的三个地点收集，这些传感器与日本气象厅开发的参考监测器（自动气象数据采集系统-AMeDAS）搭配使用。在他们的研究中，环境条件的突然变化导致了几次校准误差。他们的工作显示了使用来自相距甚远的地点的数据进行传感器校准的效果，突出了地点之间环境差异的影响。Zimmerman等人研究了三种校准方法，包括实验室校准、MLR和随机森林校准技术，用于测量[19]中的CO、NO2、O3和CO2的RAMP传感器包。他们的工作调查了不同浓度范围内模型的准确性，并检查了模型变量的重要性··222不适用Okafor，Y.Alghorani和D.T.Delaney/ICT Express 6（2020）220多参数校准模型中包含的多个变量可以帮助提高模型的性能并产生更准确的结果[20，21]。通过数据融合过程将来自不同传感器节点的数据集成到校准模型中，也可以为模型预测目标变量产生更一致，更准确和有用的信息，远远超过单个传感器可以提供的信息。然而，包括许多不相关的参数可能会使校准方程更加复杂且难以解释[23]。排除冗余变量校准模型可以提高模型的精度，简化信号处理和数据采集过程。逐步回归已被建议作为构建多参数模型时特征选择的可行策略 [23] 。最佳子集回归（BSR）技术在[24]中提出，用于选择校准模型的特征/预测因子的最佳子集。虽然在物联网，机器学习（ML），数据融合和传感器校准的各个领域已经有了大量的研究，但目前还没有研究将这些技术聚合成一个完整的环境监测解决方案，通过集成数据融合和机器学习技术进行误差建模和物联网传感器校准，可以显着提高LCS的数据质量。3. 动机在环境监测网络中实现高空间密度地面覆盖对于提供可用于验证远程和卫星监测的额外数据集至关重要。LCS在实现高密度原位监测网络方面发挥了重要作用。然而，将LCS用于此目的的主要挑战是招募错误数据的可能性很高。识别和消除这些误差对于LCS在环境监测中的应用具有重要意义。校准传感器以消除传感器响应误差并确保收集质量数据所涉及的过程是昂贵、繁琐和耗时的。几个环境因素可能会影响传感器的输出，因此有必要识别和解释这些变量对传感器输出的影响。此外，有效的特征选择是必不可少的，使校准模型的学习任务更有效和准确，同时也有利于传感器输出误差的建模。选择对模型预测能力具有高度影响的变量的任务在这项研究中采用的方法涉及到识别环境功能，影响LCS输出FS，BE和EFS和建模传感器误差的基础上确定的功能。该方法便于传感器校准，并使数据质量改善的过程更有效。4. 数据集描述和处理本研究中使用的数据集由Duvall等人在[26]中提出，它包括臭氧的测量浓度（O3）和二氧化氮（NO2），这些数据是使用CairclipO3/NO2和 CairclipNO2 传感器在德克萨斯州休斯顿收集的。CairclipO3/NO2 传感器提供 O3 和 NO2 的总浓度，而CairclipNO2传感器仅测量NO2。在2013年9月4日至27日期间，传感器与联邦参考监测器（FRM）并置。用Benzol8002 型分析仪，用乙烯化学发光 FRM 测定 O3 。使用Teledyne Model T200 U 分析仪（ Teledyne API; SanDiego，CA，USA）通过气相化学发光FRM测量NO2关于传感器和FRM的更多详细信息可参见[26]。根据制造商在[27]中描述的程序，通过从最接近cairclipO3/NO2 传感器的cairclipNO2传感器中减去NO2值，从cairclipO 3/NO2传感器中获得O3尽管cairclipO3/NO2传感器被设计用于测量O3和NO2的总浓度，但先前的研究已经确定该传感器对NO2的灵敏度较低 [28]。从CairclipO3/NO2传感器获得的单独O3数据与O3参考仪器的数据显示出良好的一致性（Pearson相关系数r=0.82）。然而，来自cairclipNO2传感器的NO2数据与参考NO2数据显示出较低的一致性（r=0.08）。本研究中的所有实现都是在Python 3中完成的，在Anaconda发行版中提供的一个笔记本上。安装了额外的库包，包括mlx- tend，它促进了模型实现的便利性，Keras[29] 和 TensorFlow [30] 用于神经网络实现。利用 6 个CairclipO3/NO2传感器（ S1 、 S2 、 S3 、 S4 、 S5 、 S6）、 4 个CairclipNO2传感器（N1、N2、N3、N4）的数据、O3和NO2参考仪器的数据以及温度（T）和相对湿度（RH）传感器的数据进行了研究。传感器S1和N1与T和RH一起位于同一位置，将FRM和传感器放置在FRM分析仪入口附近的取样拖车顶部。其他传感器由附近学校的公民科学家操作。对所收集的数据进行的相关性分析表明，大多数O3传感器和O3参考数据之间具有良好的相关性，而来自不同O3传感器节点的数据之间没有相关性。NO2传感器之间无相关性以及参考数据。对于所有传感器和参考监测器，每分钟收集一次数据，并将其平均为每小时测量值。数据集的初始评价显示缺失值很少，使用平均值插补处理缺失数据，允许用观察值的平均值替换每个缺失数据点。本研究共获得并使用了576个数据点70%的数据集用于训练模型，30%用于测试模型。测试数据是数据集的最新部分。对于所有模型，在未用于训练模型的测试数据集上评估其性能。不适用Okafor，Y.Alghorani和D.T.Delaney/ICT Express 6（2020）220223表1FFS，BE和EFS特征选择模型的性能比较R2R2图1.一、一般特征选择程序。5. 传感器标定先前的研究已经确定了SLR模型在捕获与环境条件相关的传感器响应的时间变化性方面的弱点[31]。为了在低成本物联网传感器网络中实现有效的校准，必须通过将传感器的观测值与参考仪器的观测值进行比较来对传感器的错误率进行建模。如果能够充分考虑到温度和相对湿度等环境因素对传感器输出的影响，则该过程将更加有效在这项研究中，影响O3和NO2浓度估计的因素，确定通过特征选择方法。数据融合的过程中，然后合并到一个校准方程识别的影响因素，以纠正LCS中的错误，以提高传感器的数据质量在校准模型中包含不重要的特征会导致模型的复杂性、过拟合和低性能。因此，有必要确保校准方程中仅包括与目标变量具有强相关性一个一般的方法，为功能选择说明图。1 .一、5.1. 特征选择对前向特征选择（FFS）、后向消除（BE）和穷举特征选择（EFS）三种特征选择方法的性能进行了评价，以确定它们选择最佳特征子集的能力，从而为使用CairclipO3/NO2和CairclipNO2传感器的O3和NO2浓度该系统能够确定环境变量T、RH对目标气体估计的影响。对于每种方法，使用随机森林回归器通过评估所有可能的特征组合（传感器节点和环境因素）并选择产生最佳组合来用于估计目标气体的真实值的结果。在所有三种方法中，树的数量（n个估计量）设置为100，n个作业=-1。对FFS和BE进行了4倍交叉验证，但未对EFS进行交叉验证。进行的网格搜索交叉验证（Grid-SearchCV）显示这些参数对于模型是最佳的，因此，选择它们用于模型实现的原因。R2得分被用作评价特征选择模型性能的评分度量。R2是决定系数，它衡量预测值和观测值之间线性关系的强度。表1给出了所有三种特征选择方法的比较。对于O3估计，可用的特征总数为8个，并且FFS、BE和EFS算法各自被设置为从整个特征集中选择6个性能最优的特征子集。表1中示出了由每种方法选择的特征的列表。从分析中，EFS优于其余的方法，R2得分为0.977对BE和FFS分别为0.808和0.806。此外，对于 NO2 的估计，EFS表现最好， R2为0.936，优于BE和FFS，两者的R2均为0.513。特征选择过程对于旨在完成这项工作的任务是重要的，因为它有助于有效地选择对目标气体估计有重大贡献的节点和环境因素。它通过从模型中排除与其他变量高度相关的变量来消除冗余，帮助校准模型更快地训练，降低计算成本和复杂性，从而促进整个校准过程的便利性。随后，我们应用数据融合技术将EFS（本研究中性能最好的特征选择方法）选择的特征融合，建立了cairclipO3/NO2和cairclipNO2传感器的线性回归和人工神经网络标定模型。5.2. 数据融合为了保证为标定模型提供更加一致和准确的信息，应用数据融合技术将来自不同传感器节点的数据融合到用于模型实现的标定方程中。在这里，我们提出了一个客观的手段，通过一个线性估计方法，结合不同节点的观测，为校准模型提供更多有用的信息。这种做法不仅有助于缩小任何差距，FFS被EFS功能总数888O选择的功能数量66630.8060.8080.977所选要素S1、S3、S4、S5、S6、TS1、S2、S4、S6、T、RHS1、S2、S4、S5、S6、RH功能总数666NO选择的功能数量55520.5130.5130.936所选要素N1、N3、N4、T、HN1、N3、N4、T、RHN1、N3、N4、T、RH224不适用Okafor，Y.Alghorani和D.T.Delaney/ICT Express 6（2020）220这些数据存在于单个传感器的数据集上，但将有助于提供远远超出单个传感器所能提供的观测的详细空间模式。使用数据融合，我们首先结合所有可用的传感器的数据，包括从温度和相对湿度传感器的数据，以估计值为O3和NO2使用FRM的观测作为参考。最后，通过EFS特征选择模型识别的气体估计所需的最佳特征子集被应用于单独的方程中以建模和校正传感器误差。在特定时间（t0）的估计浓度（Y）使用方程计算。（一）Y_n （t_0）=α+β1x1（t_0）+β2x2（t_0）+···βnxn（t_0）+βn（t_0）（1）其中α是截距，β1至βn是回归系数，x1至xn是预测变量的值，α是常数误差项。5.3. 传感器校准用SLR、MLR和ANN模型对用于O3测量的CairclipO3/NO2传感器和用于NO2测量的CairclipNO2 SLR模型仅使用一个独立变量/特征（即仅来自一个传感器的测量值），使用这种方法，每个传感器单独校准以校正其输出中的偏差。使用MLR和ANN模型，使用以下方法校准传感器：(i) 所有可用功能。(ii) EFS选择特征子集5.4. 简单线性回归（SLR）在所检测的6个O3传感器中，有3个传感器与参考测量值具有足够的相关性（r> 0.6），而所有NO2传感器与参考测量值的相关性都很差（r 0.1）。SLR模型用于校准每个单独的传感器，以校正其测量误差。在校准过程中，使用等式2，将传感器测量值相对于参考测量值进行回归。（2）和（3）分别适用于O3和NO2传感器。该过程能够将O3传感器的平均RMSE从28.72ppb降低到20.65ppb。O3参考=α+β1S1+β2NO2参比=α+β1N1+β 2（3）O3参考和NO2参考是来自参考监测器的浓度，S1和N1分别是来自cairclipO3/NO2和cairclipNO2传感器之一的O3和NO25.5. 多元线性回归为了考虑多个变量对传感器测量的影响，使用MLR来校准传感器。应用数据融合过程将来自不同传感器节点的数据（包括第5.2节中描述的环境数据）合并到单个校准方程中，为模型估计目标气体提供更多有用的信息。变量之间的关系描述在方程中。（4）和（5）。O3参比=α+β1S1+β2S2+β3S3+β4S4+β5S5+β6S6+β7（T emp）+β8（RH）+ β7（T emp）（四）NO2参比=α+β1N1+β2N2+β3N3++β4N4+β5（T emp）+β6（RH）+ β 5（T emp）（五）所有传感器和 FRM 的测量单位均为十亿分之一（ppb）。首先使用所有可用的特征对传感器进行校准传感器数据、T和RH数据被用作预测变量，FRM数据被用作参考。使用这种方法校准传感器，使传感器和参考数据之间的一致性更好，将参考数据和传感器数据之间的平均绝对误差（MAE）降低了7.15 ppb。5.6. 人工神经网络采用三层BP神经网络模型对传感器进行标定。该模型使用所有可用的特征以及EFS模型选择的特征作为输入变量来构建。对于O3测量，校准模型有8个输入（S1... S6，温度，RH数据），六个隐藏层（每个具有13个神经元）和1个输出层（FRM测量）。该架构是在评估主要涉及n个隐藏层（n= 3，6，9，12）和不同训练轮的不同架构之后选择的。训练了250个epoch的n=6的网络架构实现了最佳性能，因此被选择用于本研究。Adam被用作优化器，使用的激活函数是ReLu，均方误差被用作损失函数，学习率被设置为0.003。用该方法标定CairclipO3/NO2传感器，结果表明，该传感器的数据质量得到了很好的改善，而标定CaiclipNO2传感器的结果没有明显改善。5.7. 评估指标为了评估校准模型的性能，使用三个拟合优度指标（平均绝对误差（MAE）、均方根误差（RMSE）和决定系数（R2））将校准前后的传感器测量值与参考测量值进行比较。MAE度量了一组预测中误差的平均大小，而不考虑它们的方向，在本研究中，我们将MAE作为预测值和观测值之间绝对差异的测试数据集的平均值。RMSE通过计算预测值和实际值之间一不适用Okafor，Y.Alghorani和D.T.Delaney/ICT Express 6（2020）220225图二、 O3参考和传感器（a）时间序列测量（b）相关图。图3.第三章。 NO 2参考和传感器（a）时间序列测量（b）相关图。MAE和RMSE两者的较低值指示良好的模型性能。虽然MAE是一个高性能的评估指标，但我们在本研究中也使用了RMSE，因为它在校准模型中不希望出现大误差的情况下很有用。R2是从独立变量可预测的因变量方差的比例。它是相关系数（r）的平方，其中r是观测值和预测值之间线性关系的强度。通常在0到1的范围内，R2接近1反映与参考测量的良好一致性，而小的R2表示拟合质量差。6. 成果和业绩评价图图2和图3分别显示了O3和NO2虽然来自传感器的O3测量结果与参考数据显示出良好的相关性，但NO2传感器测量结果与参考数据显示出较差的相关性。为了测试校准模型的性能，将模型应用于未用于模型拟合的测试数据集。从传感器的O3和NO2的浓度进行了比较，表2当传感器未校准（S1Raw）、使用简单线性回归方法S1（SLR）校准、使用多元线性回归（Sn（MLR）和神经网络（Sn（ANN））校准时，将cairclipO3/NO2传感器输出与参考测量值进行比较，其中所有可用特征（All）和 EFS选择的特征。S1（原始）S1（单反）Sn（MLR）Sn（ANN）所有EFS所有EFS拦截18.17120.531.6Mae16.189.0310.657.819.017.19RMSE18.5712.5812.9310.2412.269.690.03卢比0.710.690.810.710.83参考监视器。用于校准O3数据的不同模型的性能比较见表2。结果表明，利用SLR方法对传感器数据进行校正后，传感器原始数据与参考数据之间的相关性得到了很好的改善。该过程将传感器和参考数据之间存在的MAE减少了40%以上，并将R2从0.027增加到0.706。MLR校准模型对这一结果有所改善，然而，ANN模型优于MLR和SLR模型。结果还表明，利用所选特征建立的MLR和ANN模型，226不适用Okafor，Y.Alghorani和D.T.Delaney/ICT Express 6（2020）220见图4。O3传感器（S1）和参考测量值（O3_Reference）在校准前和用人工神经网络校准后的小时平均数据的时间序列。通过EFS特征选择算法产生了更好的结果比使用所有可用的功能开发的模型。本研究的结果不仅表明了传感器校准在提高低成本物联网传感器数据质量方面的有效性以及人工神经网络在此方面的高性能，而且还表明了环境监测网络中传感器现场校准中特征选择的重要性和便利性。图4.给出了O3参考测量值的时间序列，其中包括原始的和ANN校准的传感器输出。该图显示了校准过程如何能够缩小传感器和参考测量之间存在的误差差距。参考和传感器原始数据、SLR、MLR和ANN校准数据之间的MAE和R2条形图见图1和图2。分别为5和6这些图显示了各种校准方法在提高传感器相对于参考数据的数据质量方面的效果。分析表明，未经标定的CairclipO3/NO2传感器输出与FRM输出之间的MAE值明显偏高，表明传感器在准确捕获O3浓度方面存在局限性，采用SLR模型标定传感器后，该误差减小了一半当应用MLR校准来校准传感器输出时，观察到SLR模型的改进。然而，使用EFS选择的特征作为预测因子构建的ANN模型给出了最佳结果。在图中也可以看到。 6，未校准的传感器数据和参考数据之间存在的低R2值，以及当应用各种校准模型时该值的改善，表明校准过程后传感器和参考数据之间的一致性改善。7. 结论低成本物联网传感器有能力为实时环境监测做出贡献，提供高分辨率图五. 当传感器未校准（S1 Raw）、使用SLR方法校准（SLR）、使用具有所有可用功能的MLR校准（MLR（全部））和EFS选择的功能（MLR（EFS））、使用ANN（全部）和ANN（EFS）校准时，O 3传感器和参考测量值的MAE。见图6。当传感器未校准（S1 Raw）、使用SLR方法校准（SLR）、使用具有所有可用功能的MLR校准（MLR（全部））和EFS选择的功能（MLR（EFS））、使用ANN（全部）和ANN（EFS）校准时，O3传感器和参考测量值的 R2时空数据集然而，低成本的传感器在现场部署时需要频繁校准，以确保收集准确的数据。机器学习方法，如因为线性回归和神经网络可用于校准低成本传感器;调节传感器测量值以与来自参考监测器的浓度进行比较。低成本传感器可能会受到温度和湿度等环境因素的影响。因此有必要将这些因素纳入校准模型，它们对传感器响应的影响，以确保有效校准。然而，在校准方程中包括几个无关紧要的变量将增加其计算复杂性并降低校准模型的精度。因此，对于给定的测量，识别影响传感器数据质量的环境因素，然后将这些因素应用于开发校准模型是很重要的。本文采用前向选择法、后向消除法和穷举特征选择法三种特征选择方法，对影响CairclipO3/NO2传感器测量O3浓度和CairclipNO2传感器测量NO2浓度的因素进行了研究。所有三种方法的性能进行了比较，对彼此和穷举特征选择方法给出了最好的结果。然后将EFS方法的结果应用于线性回归和人工神经网络模型来校准传感器，使用数据融合过程将来自不同节点的数据合并和集成到校准模型中。研究结果表明，特征选择在建立精确的多参数定标模型中的重要性，以及SLR、MLR和ANN在环境监测网络中低成本传感器定标中的有效性。不适用Okafor，Y.Alghorani和D.T.Delaney/ICT Express 6（2020）220227CRediT作者贡献声明恩瓦马卡大学Okafor：概念化，方法论，软件，数据策展，写作-原始草稿，可视化，调查，验证，写作-审查&编辑。Yahia Alghorani：资源，评论编辑。德克兰·T德莱尼：监督，调查，验证，写作-重新查看&编辑.竞合利益作者声明，他们没有已知的可能影响本文所报告工作确认这项工作由荷兰斯伦贝谢基金会通过未来学院计划、高等教育信托基金（TETFUND-Nigeria）和爱尔兰EPA研究计划（2014- 2020）下的Smart- BOG项目提供支持。引用[1] J. Talavera等人，审查物联网在农业工业和环境领域的应用，计算。Electron. Agric. 142（2017）283-297，可用：h t t p：/ / d x. 多岛或g/10。1016/j。compag. 201709。015[2] F.M. Bublitz等人，环境和健康研究的破坏性技术：人工智能，区块链和物联网概述，Int. J. Environ。Res. Public Health 16（20）（ 2019 ） 3847 ， Available ： http ： //dx. 多岛或 g/10 。3390/ijrh16203847。[3] M. Gao，J. Cao，E. Seto，一个低成本连续读数传感器的分布式网络，用于测量Xi PM2.5的时空变化，中国，环境。污染。199（2015）56 -65，可用：h t t p：/ / d x. 多岛或g/10。1016/j。envpol.201501. 013.[4] N. Okafor，D. Delaney，基于物联网的自主生态传感系统设计的考虑因素，Procedia Comput。Sci. 155（2019）258 -267，可用：h t tp：/ / d x. 多岛或g/10。1016/j。中华人民共和国2019. 08. 03 7[5] F.毛氏K. Khamis，S. Krause，J. Clark，D. Hannah，低成本环境传感器网络：最近的进展和未来的方向。地球科学。7（2019）可用：http：//dx. 多岛或g/10。3389/feart. 2019. 00221.[6] A. Rai等人，从终端用户的角度看户外低成本传感器空气污染监测，科学。全面环境。607-608（2017）691-705，可用：h t t p：/ /d x. 多岛或g/10。1016/j。n.秘密，秘密201706. 266.[7] R. Williams等人，空气传感器指南，科学目录，美国环保署，2019年，[在线]。可用：https：//cfpub.埃帕gov/si/si_public_record_report. cfm？dirEntryId=277996. （2019年11月2日[8] C. Borrego 等人，空气质量微传感器与参考方法的评估：EuroNetAir联合演习，Atmos。Environ. 147（9）（2016）246-263。[9] D. Hagan等人，电化学的校准和评估空气质量传感器与监管级仪器Atmos共处一地。Meas. Tech. 11（1）（2018）315 -328，可用：h t t p：/ / d x. 多岛或g/10。5194/at-11-315-2018.[10] L. Sun，D. Westerdahl，Z. Ning，开发和评估a novel and cost-effective approach for low-cost NO 2 sensor drift correction，Sensors17（8）（2017）1916，Available：http：//dx. 多岛或g/10。3390秒17081916.[11] F.德莱恩湾Lebental，H. Rivano，In situ Calibration algorithms forenvironmental sensor networks：A review，IEEE Sens. J. 19（15）（2019）5968-5978，Available：h t t p：/ / d x. 多岛或g/10。1109/jsen. 2019. 2910317.[12] M. Syafrudin，G. Alfian，N. Fitriyani，J. Rhee，性能分析基于物联网的传感器、大数据处理和机器学习模型在汽车制造中的实时监控系统，传感器18（9）（2018）2946，可用：http：//dx. 多岛或g/10。3390/s18092946.[13] G. Manes等人，使用分布式点源传感基础设施在危险场所进行实时气体排放监测，Sensors 16（1）（2016）121，可用：http：//dx. 多岛或g/10。3390秒16010121[14] S. Pandey，K. Kim，基于NDIR的传感器的相对性能空气中二氧化碳的近实时分析，传感器7（9）（2007）1683 -1696，可用：h tt p：/ / d x. 多岛或g/10。3390/s7091683.[15] Jiao等人，社区空气传感器网络（CAIRSENSE）项目：美国东南部郊区环境中低成本传感器性能评估，Atmos。Meas. Tech. 9（11）（2016）5281 -5292，可用：h t t p：/ / d x. 多岛或g/10。5194/at-9-5281-2016.[16] M. Badura，P. Batog，A. Drzeniecka-Osiadacz，P. Modzel，用于环境颗粒物测量的低成本传感器校准的回归方法，SN Appl.Sci. 1（6）（2019）可用：http：//dx. 多岛或g/10。1007/s42452-019-0630-1。[17] S. Munir，M. Mayfield，D. Coca，S. Jubb，O. Osammor，分析低成本空气质量传感器的性能，其驱动因素，相对优势和城市校准-在谢菲尔德，环境案例研究。监测。评估。191（2）（2019）可用：http：//dx. 多岛或g/10。100710661-019-7231-8.[18] K.山本，T. Togami，N.山口，S。Ninomiya，基于机器学习的使用环境数据校准低成本空气温度传感器，传感器17（6）（2017）1290，可用：http：//dx. 多岛或g/10。3390秒17061290[19] N. Zimmerman等人，使用随机森林的机器学习校准模型可提高传感器性能，以实现低成本的空气质量监测Atmos。Meas. Tech. 11（1）（2018）291-313，可用：h t t p：/ / d x. 多岛或g/10。5194/at-11-291-2018.[20] L. Spinelle ， M. Gerboles ， M. 维拉尼河 Aleixandre ， F.Bonavitacola，校准一组低成本传感器，环境空气中的空气污染，传感器（2014）21[21] B.马格岛Saukh，D.哈森弗拉茨湖Thiele，交叉敏感传感器的部署前测试、增强和校准，ACM，2016年，pp. 169比180[22] P. Schneider ， N. 卡斯泰尔湾 Vogt ， F. Dauge ， W. Lahoz ， A.Bartonova，使用低成本传感器和模型信息的观测结果近实时绘制城市空气质量，环境。Int. 106（2017）234 -247，可用：h t t p：/ /d x. 多岛或g/10。1016/j。恩vint。201705。005。[23] X.方岛Bate，使用多参数校准城市环境中的低成本传感器，在：嵌入式无线系统和网络国际会议论文集，2017年，第103页。1-11.[24] L. Spinelle ， M. Gerboles ， M. 维拉尼河 Aleixandre ， F.Bonavitacola，现场校准的一组低成本可用：传感器用于空气质量监测A部分：臭氧和二氧化氮，传感器执行器B 215（2015）249-257。[25] Powerpoint演示文稿，2020，[在线]。可用：https：//webcache. 我们的合作伙伴。com。（2020年2月21日）。[26] R. 杜瓦尔河长， M 。比弗， K. Kronmiller ， M. Wheeler ， J.Szykman，臭氧和二氧化氮低成本传感器的性能评估和社区应用，传感器16（10）（2016）1698，可用：http：//dx。多岛或g/10。3390秒16101698.[27] Env

下载后可阅读完整内容，剩余1页未读，立即下载

cpongm

粉丝: 5
资源: 2万+

数据融合与机器学习提高环境监测网络低成本传感器数据质量的研究

传感器数据融合

数据融合与传感器建模

多传感器数据融合研究

基于深度学习的多传感器数据融合监测火灾的国内外研究现状

机器学习是什么时候与无线传感器网络相结合的

bp神经网络 传感器融合

基于ros的视觉传感器数据融合

传感器采集数据处理技术

VI. 机器学习在网络安全中的挑战和未来研究方向 本部分主要介绍机器学习在网络安全中面临的挑战，例如数据不平

ros小车各传感器配置方法和多传感器融合方法

5g机器学习流程 数据收集特征工程数据清洗

商业大数据分析与机器学习 pdf

多源数据融合网络模型

机器学习在计算机网络中的应用

数据挖掘与机器学习的应用情况

s数据挖掘与机器学习课本pdf

我想要关于机器学习和无线传感器网络的最新研究趋势

slam中的机器学习

多模态传感器融合方法

最新资源

bp神经网络传感器融合

VI. 机器学习在网络安全中的挑战和未来研究方向本部分主要介绍机器学习在网络安全中面临的挑战，例如数据不平

5g机器学习流程数据收集特征工程数据清洗