没有合适的资源?快使用搜索试试~ 我知道了~
沙特国王大学学报无线传感器网络离群点检测策略综述Bhanu Chandera,G.库马拉维兰b印度本地治里大学Karaikal校区工程技术学院计算机科学系研究学者b印度本地治里大学Karaikal校区工程技术学院计算机科学系阿提奇莱因福奥文章历史记录:收到2020年2021年2月13日修订2021年2月23日接受2021年3月4日网上发售保留字:无线传感器网络离群点检测分类数据驱动方法A B S T R A C T无线传感器网络(Wireless Sensor Networks,WSNs)是近几十年来迅速发展起来的一种新型网络,受到了科学界和工业界的广泛关注。在无线传感器网络中,分布在恶劣环境中的传感器节点很容易受到故障和攻击,导致传感器读数不可靠和不准确。在这种情况下,与健康行为有很大差异的传感器读数将被视为异常数据或异常/离群值。在数据分析中纳入这些离群值将不可避免地影响决策过程的结果。因此,使用数据驱动的方法检测无线传感器网络中的离群值成为机器学习(ML)社区中的一种新技术。同时,在测量部署的ML算法在检测WSNs中的离群值时的性能方面存在各种研究问题,WSNs通常包含用于确保数据质量的计算能力和电源因此,本文提出了一个全面的概述了国家的最先进的统计和人工智能(AI)为基础的技术用于无线传感器网络中检测离群点的架构,类型,程度,方法和检测模式。此外,上述每一种异常值检测方法都进行了详细的讨论和未来的发展范围。版权所有©2021作者。由爱思唯尔公司出版代表沙特国王大学这是一个开放的访问CC BY-NC-ND许可证下的文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。内容1.介绍56852.背景和材料56862.1.定义56862.2.异常值的类型2.3.获取离群值的可能方法2.3.1.噪音或错误56882.3.2.事件56882.3.3.恶意攻击56882.4.离群值的尺寸2.5.属性相关性56892.6.离群值检测方法的体系结构56903.离群值检测方法3.1.检出率56903.2.假阳性率56903.3.接收机工作特性56903.4.事件识别措施3.5.计算复杂度5690*通讯作者。电子邮件地址:gujurothubhanu@gmail.com(B.Chander)。沙特国王大学负责同行审查3.6.用户特定参数56903.7.离群值的程度:标量和离群值得分。 56914.无线传感器网络5691中的离群点检测问题4.1.高通信成本56914.2.动态网络拓扑56914.3.资源限制56914.4.分布式流数据5691https://doi.org/10.1016/j.jksuci.2021.02.0121319-1578/©2021作者。由爱思唯尔公司出版代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。制作和主办:Elsevier可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页:www.sciencedirect.comB. Chander和G. 库马拉维兰沙特国王大学学报56854.5.高维数据56915.离群值检测方法的分类56925.1.基于统计的方法56925.1.1.基于参数的方法56925.1.2.非参数方法56935.1.3.基于统计方法的讨论56935.1.4.研究问题56945.2.基于人工智能的方法56945.2.1.基于人工智能的方法56955.2.2.研究问题56955.3.基于距离的方法56955.3.1.基于距离的方法的讨论5.3.2.研究问题56975.4.基于聚类的方法56975.4.1.基于聚类的方法的讨论5.4.2.研究问题56985.5.分类方法56985.5.1.讨论基于分类的方法57026.无线传感器网络中现有离群值检测方法的局限性7.无线传感器网络中离群点检测的开放研究问题8.WSNs中异常值检测的一流要求9.WSNs中离群值模拟的基准数据集10.结论5705参考文献57051. 介绍WSN由分散在通常称为传感器场的扇区上的必要数量的传感器节点组成(Guptha和Sinha,2014; Shabbir,2013)WSN中的每个传感器节点都配备有巨大的潜力,如无线电通信信道和处理元件(Amer和Goldstein,2012; Breunig等人,2000年)。 这些广泛且无线连接的传感器节点收集传感器领域的相关数据,并将观测到的数据传输到权威的汇聚节点进行必要的操作,如预处理和特征提取( Chander 和 Kumaravelan , 2018; Grubbs , 1969; Chirayil 等人,2019; Singh和Rautela,2016)。一般来说,在任何感兴趣的领域部署WSN包括三个首先,在无线传感器网络中部署的传感器节点必须感测特定的环境方面。其次,它必须存储收集到的数据并进行某些预处理操作。最后,每个传感器节点必须与其相邻节点和汇聚节点建立连接。在无线传感器网络中,传感器节点基本上由四个部件组成,即,传感单元、处理单元、传输单元和电源单元。首先,感测单元由传感器和ADC(模数转换器)组件组成,ADC组件的功能是从模拟信号生成数字信号其次,处理单元由微处理器或具有小存储单元的微控制器组成,以智能地控制传感器节点第三,传输单元由收发器组成,以通过采用短距离射频频谱在网络上执行数据传输/接收。最后,电源单元为上述所有单元供电,以实现其各自的功能(Ayadi和Ghorbel,2017; Xie和Han,2011; Dan等人, 2019年)。大多数无线传感器网络都部署在恶劣的环境中,人类可能无法建立网络。因此,WSN首先在军事应用中被开发和部署;后来,它们的效用扩展到各种领域,如环境监测、结构健康监测、灾害监测、农业、目标跟踪和工业应用(Kumar等人,2019;Kurniabudi等人,2019; Titouna等人,2015; Singh和Rautela,2016)。最近,更多的实验正在进行中,以提高无线传感器网络在建筑智慧城市然而,传感器数据的可靠性和准确性对于智能决策必须没有错误(Perrig等人,2004年)。但无线传感器网络中测量和收集的数据主要受内部和外部因素的影响(Ayadi和Ghorbel,2017; Xie和Han,2011; Dan等人,2019年)。内部因素包括传感器节点质量,例如资源约束、存储器、成本、电池功率、通信带宽和具有不一致数据点、噪声、错误和缺失值的传感器节点的数据的数据生成。外部因素取决于WSN中传感器节点的数量及其对攻击类型的脆弱性,例如拒绝服务攻击,回复和黑洞攻击等(Chander和Kumaravelan,2018; Raihan Ul等人,2016年)。因此,它被认为是在无线传感器网络中的传感器节点的数据是不可靠的和异常的,由于这些种内部和外部因素,进一步操纵的整体结果。因此,在传感器节点中,从感测数据偏离预期行为的测量被认为是离群值或异常。在这种情况下,识别/检测传感器网络中部署的传感器节点中的离群值的需要起着至关重要的作用,因为它包含功能信息。因此,有必要设计一个一致的技术来检测71755012700 000无线传感器网络中的离群值。最近,无线传感器网络中的各种离群值检测方法已用于许多实时应用,如健康观察、环境观察、欺诈检测、入侵检测 、 火 灾检 测 、 管 道 泄漏 和 目 标 跟 踪( Ayadi 和Ghorbel , 2017;Kurniabudi等人,2019; Xie and Han,2011)。例如,在数据特征未知的情况下,要找出异常值,则需要使用显式规则来发现异常值。但是,在数据集包含一些标准和异常数据特征的情况下,基于预定义分类器的机器学习技术在发现这些离群值方面发挥着至关重要的作用。同时 , 跟 踪 可 能 在 自 然 灾 害 中 发 挥 重 要 作 用 的 异 常 值 总 是 很 好 的(Guptha和Sinha,2014; Hodge和Austin,2003; Shabbir,2013;Chirayil等人,2019;Ni和Xia,2009; Shabbir和Hasan,2013)。因此,离群值检测是一种发明过程,其有助于发生了什么我们需要寻找什么它必须找出数据本身中有趣的模式或概念。从文献中可以清楚地看出,基于ML的数据驱动算法B. Chander和G. 库马拉维兰沙特国王大学学报5686Fig. 1. 无线传感器网络中离群点检测的范例。被证明在处理预处理数据时提供良好的结果因此,现在具有窗口技术的DL模型在克服基于ML的方法中产生的缺点方面变得更加流行(Tan , 2006; Dan 等人,2019;Durisic 等人,2012; Harkins 等人, 2002年)。窗口化概念处理棘手的、不稳定的数据模式,将原始信号的小然而,大多数现有的上述数据驱动的方法将异常值作为错误进行聚集,并且它们没有关注事件,这可能导致关键隐藏信息的丢失(Cheng和Li ,2006; Kurniabudi 等人,2019; Bangash和Al-Salhi,2017; Ayadi和Ghorbel,2017)。图1示出了无线传感器网络中特别是,有三个广泛的处理方法,以实现实际和易于处理的离群点检测在无线传感器网络。首先,基于误用/签名的检测方法,实现了以前产生的攻击作为一个参考点,以检测潜在的未来攻击。该方法的主要优点是能够以较低的错误承诺率正确地检测先前的攻击;然而,该方法不能处理正常类型的攻击,如拒绝服务攻击、应答攻击等。其次,协议状态分析方法涉及一些标准程序和指南,用于比较定期确认的传感器节点的预定配置文件以检测离群值(Ayadi和Ghorbel,2017; Kurniabudi等人,2019; Xie andHan,2011)。然而,这两种方法都涉及复杂的计算,需要大量的内存,这在无线传感器网络的设置中主要是不支持的因此,如今,数据驱动的方法在研究界受到了广泛的赞赏。因此,本文提供了一个比较分析的类别下的统计,人工智能,距离,聚类和分类为基础的方法来检测异常值的无线传感器网络中的各种数据驱动的技术而且所有使用现有技术的评估度量来比较所述数据驱动的离群值检测技术。2. 背景和资料2.1. 定义近几十年来,无线传感器网络在工业和科学界引起了越来越大的兴趣,因为它具有识别和访问特定感兴趣区域的巨大潜力,这反过来又为科学家和研究人员提供了丰富的信息(Ayadi和Ghorbel,2017; Xie和Han,2011; Shabbir和Hasan,2013)。当前数据分析领域的发展使得异常值检测成为一项重要任务。此外,由于其在现代电器中的重要性,作为一个活跃的研究课题。在这种情况下,WSN中的离群值检测也成为一项针对真实世界感知数据不断增长的任务(Ayadi和Ghorbel,2017年; Grubbs,1969年; Tan,2006年; Xie和Han,2011年;Chirayil等人,2019年)。在文献中,几位作者对离群值有不同的定义,其中几位作者如下所列离群值的第一个定义来自(Grubbs,1969),(Hawkins,1980),(V. Barnet等人,1994年)(Breunig等人, 2000),“离群点是位于关于其局部邻域密度的较低局部密度中的点”。(Jiang等人,2001年),“离群点是不属于数据集的聚类或明显小于其他聚类的聚类”。B. Chander和G. 库马拉维兰沙特国王大学学报5687(Harkins等人,2002),“在输出层没有很好地再现的点,具有高重建误差,被认为是离群值”。(He等人,2003),“如果一个点的密度相对低于其附近的高密度模式集群,或者其密度相对高于其附近的低密度模式规则性,则该点可以被认为是离群值”。(Muthukrishnan等人,2004),“如果从时间序列中删除一个点导致一个比原始序列更简单的序列,那么这个点就是一个离群值”。(Aggarwal和Yu,2005年),(Cheng和Li,2006),(Sheng等人,2007年),“一个过程,以确定数据点是非常不同的其余数据的基础上一定的措施”。(Sadik和Gruenwald,2011年),(Mrs. Ola等人,2007年),“ 与 分 析 数 据 中 的 预 期 趋 势 不 匹配 的 模 式 ” 。(Ghorbel等人,2015年),“它是分类在某些方面与训练期间可用的数据不同的测试数据”。(Titouna等人,2015年),“一个观察,偏离了很多从其他观察,可以产生不同的机制”。(Van Vuong Trinh和Kim Vuc Tran,2017),同时,请记住,在任何情况下,不能根据其特征将数据点单独确定为离群值(Aggarwal和Yu,2005; Xie和Han,2011; Harkins和He,2012)。在这种情况下,一些已知的异常事件,如系统故障和自然灾害的发生需要特别注意。因为我们不知道但我们可以建立一个系统来检测它们的差异我们已经暴露并定义为标准样本。 最后,在这个框架中,离群值是与估计的实体不同的实体,它看起来引人注目,但同时不需要。这种异常值检测与正常的异常值检测方法完全不同。 但是,我们的目标是一个奇怪的关系,发现发生了什么,我们需要寻找什么?然后通知异常检测器像往常一样相信这些新样本,并重复自然事件检测的过程。2.2. 离群值的类型设计离群值检测技术的主要目的是检测偏离标准数据的数据实例(Guptha和Sinha,2014; Shabbir,2013)。在此基础上,根据离群点与剩余数据集的关系和位置,将离群点分为全局离群点和局部离群点全局异常值是指图二. 无线传感器网络中离群点的来源B. Chander和G. 库马拉维兰沙特国王大学学报5688显著偏离正常值并捕获所有可用的数据点;这些类型的离群值可以很容 易 地 被 发 现 , 然 后 通 过 应 用 某 种 过 滤 器 来 去 除 ( Hodge 和Austin,2003; Singh和Rautela,2016)。存在两个主要类别的全局离群值,即类别1或二阶外部离群值,其将特定传感器节点的整个数据集视为与相邻节点有关的离群值。考虑结构中传感器节点的集合或子树的第2类或第三阶外部离群值可以是离群值。通常,这些类型的异常值被称为高阶外部异常值。随后,局部离群值通知数据点作为与其附近的局部邻居相关联的离群值,其通常被称为一阶离群值,其进一步被分类为以下类别:类别1或偶然绝对离群值,其是高值或低值的极其接近的进展/顺序。第2类或聚类绝对离群值是指一组或聚类离群值连续产生高值或低值。第3类或随机离群值是指那些不在原始数据阈值范围内的观测值,这意味着它在短时间内发生。(Chengand Li,2006; Hawkins,1980; Hu and Sung,2003)。通常,上述本地异常值检测技术减少了通信开销,因为不需要建立与汇聚节点(基站)的通信。然而,检测/删除局部离群值是一项比全局离群值更艰巨的任务(Ayadi和Ghorbel,2017)。2.3. 获取离群值的可能方法大多数传感器节点被布置在人类无法构建传统网络的恶劣环境中(Aggarwal和Yu,2005; Xie和Han,2011; Bangash和Al-Salhi,2017)。由于传感器节点在特定环境中的变化和资源的限制,很容易受到离群点的影响。在WSN中使用离群值检测方法的重要意义之一是确保数据的质量和可靠性(Ayadi和Ghorbel,2017; Guptha和Sinha,2014; Jiang等人,2001年; Shabbir和Hasan,2013年)。图图2显示了获取异常值的可能来源。2.3.1. 噪声或误差出现离群值的来源之一是噪声或误差,这表明数据记录来自不完善节点(Li和Xie,2015; Chen和Shubhakher,2006)。错误的数据通常暗示我们与数据集其他部分的无动机变化。大多数情况下,与部署区域中的环境、粗糙度和困难相关的变化是噪声或错误的主要原因此外,无线传感器网络易受通信故障、软件故障、电池故障、硬件故障、拓扑变化等故障的影响无效基站(Jiang和Luo,2016; Zidi和Moulahi,2018; Chirayil等人, 2019年)。硬件故障经常发生,由于硬件单元,即传感,处理,定位,电源和存储单元的故障传感器软件程序中的故障导致软件故障传感器收发器问题导致通信故障。同时,由于无线传感器网络中的资源限制、部署变化、环境类型以及正常节点和故障节点之间的相似性等问题,检测此类故障传感器节点是一项具有挑战性的因此,需要识别、消除或纠正噪声或错误(如可能);否则可能会影响收集的数据质量(Zidi和Moulahi,2018)。然而,研究人员在设计离群点检测技术时,必须记住,消除无线传感器网络中的此类离群点肯定会提高检测率的准确性。研究人员在消除这些异常值时也要小心,因为它具有太多的错误需要纠正,因为它消耗了传感器节点的高能耗和通信功率(Li和Xie,2015; Titouna,2016)。表1总结了WSNs中现有的噪声或错误检测方法的分类和比较,涉及方法论、架构、检测到的故障类型、其复杂性、检测率、相关性、准确性和数据集。2.3.2. 事件离群值的另一个来源是事件,它被认为是部署环境中经历的意外更改。(Ayadi和Ghorbel,2017年; Perrig等人,2004年)。事件的可能实例是化学品泄漏、森林火灾、洪水、火山爆发、地震和剧烈的气候变化(Raihan Ul等人,2016; Dhanya等人,2009年)。一般来说,事件在很长一段时间内只发生一次,当事件发生时,它改变了感知信息的整个历史模式。消除事件异常值可能导致丢失关于即将发生的事件的高显著性隐藏事实(Ahmad和Mureed,2013; Kavi,2013)。表2从方法论、体系结构、检测事件类型、复杂度、检测率、相关性、准确性和数据集等方面对现有的无线传感器网络事件检测方法进行了分类和比较。2.3.3. 恶意攻击恶意攻击主要改变消息恶意攻击通过控制一些传感器节点并注入伪造数据来降低节点/网络,从而为离群者铺平道路(Al-Hawawreh和Moustafa,2018)。这些离群点分为两种类型,即被动攻击和主动攻击。被动攻击是指在不中断网络通信的情况下获取数据表1无线传感器网络中现有噪声或错误检测方法的分类和比较作者准确性架构数据集类型的故障方法复杂性检测相关性(张晓,2019)高(Raghu Vamsi和Chahuan,2020)分布式IBRL分布式故障传感器故障传感器否定选择算法直方图。 信任模型高高在线在线/离线空间/时间空间/时间高(Noshad等人, 2019年度)高(Noshad等人, 2019年度)高(Jiang和Luo,2016)温和IBRL集中式IBRL分布式KDD-99、NSL-KDD集中KDD-99、NSL-KDD集中故障传感器故障传感器故障传感器随机森林随机森林SVM贝叶斯网络高 高低中度在线/离线在线/离线离线/在线在线时间空间/时间高(Chanak和Banerjee,2016年)KDD-99集中KDD-99、NSL-KDD故障传感器模糊规则中度离线/在线空间/时间B. Chander和G. 库马拉维兰沙特国王大学学报5689例如,欺骗攻击、回复攻击、sinkhole攻击和选择性转发攻击。主动攻击是通过扰乱设置的标准功能来获取数据的攻击,如中间人攻击、拒绝服务攻击(DOS)(Hadri等人,2016; Titouna等人, 2019; Naskh和Naveen,2016; Takoua等人,2020年)。表3总结了WSNs中现有恶意检测的一些分类和比较,涉及方法,架构,检测到的故障类型,其复杂性,检测率,相关性,准确性和数据集。2.4. 离群值的维数在无线传感器网络中,收集的数据可以被视为静态数据,流数据和实时数据(Ayadi 和 Ghorbel,2017; Grubbs,1969; Xie 和 Han,2011)。静态数据相同的方法将产生不同的结果与动态传感器数据。流数据-在某些设备中,传感器会持续感测数据;由于要评估的数据量很大,因此使用流数据进行离群值检测是一件发人深省的事情。实时数据- 在医疗或安全监控等少数更多的WSNs设备中,系统需要与传感器节点实时连接以产生警报消息。传统的无线传感器网络收集单一类型的数据,如压力、湿度等,其被认为是单变量数据(Gil等人,2018; Xie and Han,2011)。然而,在最近的时代,无线传感器网络的设计与传感器节点,可以同时接收不同的数据类型被称为多元数据。当拥有的特征涉及异常评估而不是另一个相关数据集时,统计数据点可以被单变量离群值是具有特定属性的单个统计点,离 群 值 , 当 该 属 性 对 于 添 加 的 数 据 集 不 寻 常 时 ( Sharma 和Golubchik,2010)。考虑一个简单的年龄的例子单变量离群值不处理它们之间的关系,也不同时考虑两个变量。单变量有两种类型:连续变量和分类变量。平均数、中位数、众数、方差、标准差、极差、百分比、直方图、箱形图、点图、折线图、均匀度属于连续单变量。计数、频率、几率、条形图、饼图都属于单变量范畴.多元离群点是指具有集合属性的统计它可以被标记为一个离群值,条件是很少有个别特征相互结合考虑到数据集的其余部分的例外标准。(Ayadi和Ghorbel , 2017; Sheng 等 人 , 2017 年 ; Kumar Smarpathi 和Verma,2010年)。多元回归、逻辑回归、方差分析、协方差分析、寿命表和属于多变量分析的因素分析方法在单变量数据的无线传感器网络中,通过比较单个属性和剩余属性来进行离群点检测是一种简单的方法。另一方面,多变量数据的离群点检测是一个问题,以及计算昂贵的任务,因为它涉及集体属性。然而,正确处理数据的不同特征之间的关系,可以提高异常点检测的准确性。2.5. 属性相关性部署在危险环境中的WSN从真实世界收集基本数据,其包含基于其属性的混合和未识别的关系(Saini等人,2004; Singh和Rautela,2016)。这些特征中的可信度称为属性相关性。在无线传感器网络中,表2现有无线传感器网络事件检测方法的分类与比较。作者准确性架构数据集类型的事件方法复杂性检测相关性(Raihan等人,(2016年)集中洪水预报基于信念规则高在线/离线时间高(Ahmad和Mureed,2013年)高(Kavi,2013年)高(Shahid等人,2012)高KDD-99、NSL-KDD集中KDD-99、NSL-KDD分布式KDD-99、NSL-KDD分布式KDD-99、NSL-KDD集中洪水预报、灾害风险洪水监测环境警报降雨基于高斯模糊关联规则高低中度中度线下离线在线离线时间空间空间/时间空间/时间中度KDD-99、NSL-KDD表3现有无线传感器网络恶意检测方法的分类与比较。作者准确性架构数据集类型的攻击方法复杂性检测相关性(Chafiq等人,2020年)高分布式KDD-99、NSL-KDDDDos/普通攻击LEACH和信任高在线/离线时间(Yin和Li,2019)高(Shone和Nguyen,2018)高(MunaAL-Hawawreh等人, 2018年)高(Hodo等人,2017年)中度分布式KDD-99、NSL-KDD分布式KDD-99、NSL-KDD分布式UNSWNB-1。NSL-KDD分布式UNB-CIC普通攻击探测/DoS探测/DoS交通/回复改进的熵权深度学习,自动编码器人工神经网络支持向量机高 高高高在线留言在线留言在线时间时间空间/时间空间(Praneeth等人,(2017年)高(Hodo等人,(2016年)高(Hadri和Chougdali,2015年)分布式KDD-99集中式模拟数据集KDD-99正常攻击Dos/DDoS回复攻击PCA-SVM神经网络神经网络中度中度高线下实体离线/在线时空时间B. Chander和G. 库马拉维兰沙特国王大学学报5690由于传感器数据随时间的动态变化,它提高了异常值检测的准确性,与不考虑任何相关性的技术相比。(Ayadi和Ghorbel,2017年; Cheng和Li,2006年; Shahid等人,2012年)。传感器数据有效地与时间和空间互连,用于实时和环境监测应用。为了区分事件和错误,离群点检测技术依赖于每个传感器节点的两种不同的相关性-首先是每个传感器节点的特性所包围的第二件事是对过去和边界节点估计的传感器评估,称为空间估计。简言之,定义为在特定时刻观察到的测量的时间关系相对依赖于之前的分析。空间相关性度量传感器节点在一个特定时刻,通过一个显著的空间范围与特定距离的邻居节点。时空传感器观测提供了一种简单的方法来理解将区分误差和异常值的传感器参数(Hodge和Austin,2003; Singh和Rautela,2016; Shabbir和Hasan,2013)。2.6. 离群点检测方法无线传感器网络由数百到数千个传感器节点组成,具体取决于计划的应用类型(Chander和Kumaravelan,2018; Durisic等人,2012;Ni和Xia,2009)。通常,WSNs中的离群点检测采用三种类型的结构:集中式,分布式和本地结构(Ayadi和Ghorbel,2017; Xie和Han,2011)。在集中式结构中,传感器节点收集的全部数据被传输到中心站,如基站(BS)或簇头(CH),在那里应用离群暴露算法来检测可能的离群点。在分布式结构中,传感器节点协同其所有相邻节点的行为,并构造全局参考模型来检测每个节点中的离群点。如果发现异常行为,它将立即向簇头或邻居节点发送警报消息。在局部结构中,每个传感器节点检测离群点,而不与相邻节点交换任何信息。许多研究人员指出,传感器节点消耗更多的能量在通信比计算。因此,考虑到上述原因,集中式结构由于将感测到的数据传输到中心位置以进行离群值检测而消耗更多的电源。为了减少能量消耗,基于分布式结构的离群点检测技术是优选的。其中本地参考模型将被发送到CH,具有用于构造全局参考模型的最小大小信息;此外,与集中式结构相比,它降低了整体通信成本。3. 离群值检测方法用于WSN的离群值检测技术主要评估该技术是否在保持低资源利用率的同时提取可用的观测值(Rajasegarar等人,2006;Suthaharan等人,2010年)。通常,为了估计预测误差,大多数离群点检测技术使用交叉验证.它使用两个主要的度量离群值不仅取决于精确的点值,还取决于数据集的模式。同样,离群值检测性能可以通过对各种输入参数和数据集进 行实验来确 定一些定量测 量来分析(Kumar 等人, 2019;Kurniabudi等人,2019; Xie and Han,2011)。不同的研究人员在不同的应用领域遵循上述方法。然而,由于不同的条件和实验设置,现有的方案可能会超过其他类似的程序。下面的一些测量作为一组独特的条件引入,以微调异常值的大小以及事件检测方法。3.1. 检出率检测率(DR)表示离群值技术准确检测到多少离群数据片段(Ayadi和Ghorbel,2017; Xie和Han,2011; Chirayil等人,2019年)。大多数情况下,检测率接近于一个特定的单位。 检测率还可以说明单独的异常值和事件检测率,其中条件是算法可以精通检测事件和异常值。当然,部署在危险环境中的无线传感器网络必须维持正常的活动。因此,期望该技术必须保持高的事件检测率以及异常值检测率。高离群值然后低事件识别率表明该方法不能区分不同的异常值源。3.2. 假阳性率被错误地分类为异常值的普通数据片段称为假阳性率(FPR)(Kumar等人,2019; Singh和Rautela,2016)。与DR相反,FPR应该尽可能低,可能使其为零。高检测率需要异常值和事件检测技术;然而,它不能允许将标准数据显示为异常值或事件。假阳性率也可以分为事件假阳性率和异常假阳性率.3.3. 受试者工作特征检测率和假阳性率之间的联盟将通过受试者工作特征(ROC)来体现。优选地,由ROC曲线覆盖的面积需要接近1。ROC曲线图表示假阳性率检测率的变化(Kumar等人,2019; Kurniabudi等人,2019; Chirayil等人, 2019年)。3.4. 事件识别检测率和假阳性率都有效地用于检测一类数据中的事件问题。当涉及到多类数据时,需要更准确的测量,因为需要找到在事件检测中最有用的类间未命中分类。在一些实时无线传感器网络设备中,离群点和事件的性质,以及用于识别特定离群点和事件的适当属性。DR和FPR是多类数据中有用的度量,精确的事件检测使DR达到100%,FPR尽可能低。 (Raihan Ul等人,2016; Kavi,2013)。3.5. 计算复杂度无线传感器网络不断地感知来自周围地理区域的海量数据.因此,设计一个合适的离群值检测技术与如此庞大的数据是一项复杂的任务。时间复杂度和空间复杂度是评价孤立点检测技术效率的两个主要指标。如上所述,传感器节点包含最小的存储器容量,因此实现离群值暴露技术所需的存储器占用可以被视为重要的评估指标。B. Chander和G. 库马拉维兰沙特国王大学学报56913.6. 用户特定参数在无线传感器网络环境中定义用户特定的参数是不是一个简单的任务,由于动态变化发生在周围的大气中的传感器节点部署。此外,它还影响了异常检测技术的熟练程度和效率。包含最小用户特定参数增加/降低了离群值检测技术的检测率 (Sheng等人,2017;Sheng等人,2007; Luo和Sai,2018)。3.7. 离群值的程度:标量和离群值评分设计的离群值检测实践不仅可以识别完全偏离常规传感器数据模式的此外,这些检测技术还测量其统计模式与标准传感器数据的差异这种信息将有助于生成警报消息,以采取适当的行动,例如在灾难发生之前预防灾难(Ayadi和Ghorbel,2017年; Gil等人,2018; Dan等人, 2019年)。在这个场景中,WSNs中的离群值在两个品牌中进行评估:标量和离群值得分。标量- 它将每个测量的感知数据点分类为正则数据点或离群数据点。通常,它是奇异的,具有一组离群值以及一组标准数据。它不区分异常值的区别,也不提供异常值的等级。这种决策也被认为是一个硬决策;在文献中,一些分类和聚类方法检测异常值与硬决策。离群值得分-离群值检测技术与离群值得分提供了离群值的阶段性记录这意味着这些类型的检测技术准确地将传感器读数分类为正常或异常值,然后为每个测量数据点指定一个异常值分数,作为测量程度具有较高离群值得分的数据点具有较高的离群值概率。这种决策被认为是一种软决策;许多现有的技术,如基于距离的,k-最近邻,产生适当的离群值沿正常数据点。4. 无线传感器网络中离群点检测的若干问题传感器数据的性质以及传感器网络的环境使得离群值检测的设计更加复杂和具有挑战性(Ayadi和Ghorbel,2017; Depaola,2015;Fazy,2013)。在文献中针对过时的系统提出了各种异常值检测技术;但是,WSN 的环境使得这些技术不适合于资源受限的WSN(Grubbs,1969; Hida等人, 2003年)。现有的检测方法大多以能量消耗最小为目标,以获得合理的检测率和较低的误检率然而,一些障碍需要考虑建立合适的离群检测方法的无线传感器网络。其中一些在下文中提到(Ayadi和Ghorbel,2017年; Alberola等人,2007;Hida等人, 2003年)。4.1. 通信成本在无线传感器网络中,许多研究人员表明,通信消耗的能量大于计算,这意味着传感器节点数据传输成本是节点数据计算成本的几倍以上(Guptha和Sinha,2014)。几乎所有传统的离群值方法都是基于集中式方法开发的,其中传感器节点收集的数据完全发送到基站或簇头进行预处理(Wu等人,2017; Sharma and Golubchik,2010).其中一些算法虽然检测率较高,但传输开销越来越大相应地,分布式离群点检测方法在传感器节点之间进行少量通信,非常适合于资源受限的节点。然而,这些通信约束遭受大量的传播延迟,信号传播,极端的路径长度,时变信道快速变化,噪声和扩散。因此,通信成本是无线传感器网络中离群点检测方法的一个基本挑战此外,如何削减通信成本以延长系统寿命并减少WSN中的网络流量也是一个主要挑战(Sara等人,2016; Sangwook等人, 2015年)。4.2. 动态网络拓扑传感器网络在特定的时间阶段安装在不确定的环境中,使其无法抵抗频繁的网络故障。一些传感器节点从一个地方转移到另一个地方以完成分配的任务;之后,它们可能具有不同的处理和感知能力(Hodge和Austin,2003; Ni和Xia,2009)。节点的移动性和通信故障加剧了网络拓扑结构的变化。此外,一些新奇的节点可能会添加或删除预部署的网络取决于特定的设备规定。此外,在未指定的情况下,节点的故障也会改变网络拓扑。这些种类的变化影响离群值检测技术的常规参考模型(Chirayil等人,2019年)。另外,WSN采用相应的传感器节点的混合(红外、热)来执行不同的工作(例如,温度、压力等)。这种类型的异质性也将扩大算法的复杂性在离群检测。4.3. 资源限制传感器节点是一种小型微电子设备,由最少的资源组成,例如有限的功率,不完美的广播能力,小存储单元和部分计算能力(Ayadi和Ghorbel,2017; Van Vuong Trinh等人,2017; Dan等人,2019年)。但是,大多数为无线传感器网络设计的离群点检测算法需要大量的内存来进行数据分析、存储,并且除了飙升的无线电通信带宽之外,还需要优越的计算复杂度。在某些情况下,传感器网络是用低质量的传感器设计的,具有经济资源约束。因此,设计用于WSN的离群值检测技术以处理用于存储的存储器的合理量以及计算任务,同时修剪能量利用率成为巨大的挑战(Van Vuong Trinh等人,2017;Dan等人, 2019年)。4.4. 分布式流数据无线传感器网络的另一个挑战是动态分布的流数据。需要流式传输感测数据以在分布式模型中建立标准参考离群值技术。然而,这种知识可能并不被认为是先验的。对于特定的时间量,只有分布式数据是可用的,并且它在未来是不合适的,因为动态流可能修改分布式工作的魔力(Andre等人,2016; Bnageshand等人,2017年)。大多数现有的离群值检测技术估计离线感测数据满足处理分布式流数据的要求;这可能不适合在线流传感器数据(Kim,2015; Jun等人,2006年)。因此,如何在设计孤立点检测时处理分布式在线流数据仍然是研究界面临的最大挑战。B. Chander和G. 库马拉维兰沙特国王大学学报56924.5. 高维数据无线传感器网络包含大量的传感数据点,每个数据点包含多个属性。此外,网络范围的扩大可能是合成数据中维度的原因(Ayadi和Ghorbel,2017; Chirayil等人,2019; Dan等人, 2019年)。建立在这些维度上的离群点检测技术增加了计算成本,同时减少了传感器节点的严格资源此外,数据维数的增加5. 离群值检测方法在离群值检测方法的设计中,必须非常小心地给出保持低计算和低功耗因子的方法。图3显示了基于分析、性能和关键特征的离群值检测方法的总体分类。5.1. 基于统计的方法基于统计的离群值检测技术是完全基于表示的程序,使用随机概率分布模型进行离群值检测(Ayadi和Ghorbel,2017; Hida等人,2003;Dan等人, 2019年)。在统计模型中,当设计的模型可能性作为距离实践进入视野时,数据点被认为是离群值。该方法建立了一个数据分布的参考模型,并根据模型的适用性来判断数据实例的出现次数。用技术术语来说,如果数据实例出现在统计模型中的概率很低,则将其测量为离群值。统计基于的方法是在20世纪
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功