没有合适的资源?快使用搜索试试~ 我知道了~
网络管理故障:报警着色与报警消隐算法在大型通信网络中的应用
沙特国王大学学报用于根本原因分析的Sudhansu Bala Dasa,Sugyan Kumar Mishrab,1,Anup kumar Sahua,2a印度奥里萨邦巴拉索尔国防研究与发展组织b印度奥里萨邦布巴内斯瓦尔C.V.拉曼工程学院阿提奇莱因福奥文章历史记录:2017年12月7日收到2018年4月11日修订2018年4月13日接受2018年4月26日在线提供保留字:网络管理故障管理告警相关告警着色警报警报根本原因分析A B S T R A C T在过去的几年中,网络管理系统在诸如规模和复杂性的在这样的系统中,组件彼此连接以提供各种服务。然而,一个组件的故障最终可能会影响其他互连组件。因此,在网络系统中可能发生服务中断问题。这个问题的解决方案之一是生成警报,以便检测故障及其可能的恢复。此外,警报将被实时处理,以避免不必要的服务中断。为此,许多研究人员提出了各种算法来处理警报。这种方法是耗时的,这是故障管理中的主要缺点。为了克服这一点,我们在这里提出了该方法包括两种新的算法,即报警着色和报警消隐。在报警着色算法中,使用颜色方案来区分报警,随后,根据区分的颜色对这些报警进行分组。所提出的方法进行了广泛的模拟,并与现有的报警分组方法(S)。©2018作者制作和主办:Elsevier B.V.代表沙特国王大学这是一CC BY-NC-ND许可下的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。1. 介绍在大型通信网络中,故障是不可避免的。由于不同的原因,如配置错误、软件错误和硬件故障,在计算机网络中产生故障(Khurshid等人,2013; Kazemian等人,2013年; Liu等人,2013年)。每种类型的故障都有不同的机制来检测,然后生成警报。警报是关于检测到的故障或异常情况的特定类型的通知。因此,关联这些不同的报警,找出根本原因是一个开放的研究问题,在故障管理。它基于将节点集区分为一个组的技术,在特定时间窗口内激活警报。这个过程是*通讯作者:综合试验场(ITR),国防研究与发展组织,Chandipur,Balasore,Odisha 756025,印度。电子邮件地址:baladas. gmail.com(S.B. Das)。1现住址:C.V.Raman工程学院,Janla,Khordha,Odisha 752054,印度。2现地址:印度奥里萨邦巴拉索尔昌迪布尔国防研究与发展组织综合试验场,邮编:沙特国王大学负责同行审查非常有助于去除冗余告警和识别故障,这又通过将大的告警数据处理成较小的数据集来减少网络管理员的工作量(Bouloutas等人,1994;Jakobson 和 Weissman , 1993;Rouvellout 和 Hart , 1995;Klemettinen等人,1999; Houck等人, 1995年)。在本文中,我们重点关注全球网络中的警报管理,以便通过捕获网络上发生的事件来处理事件(Rao,2011)。已经提出了各种方法用于告警关联方法,诸如基于规则的、基于码本的、基于案例的和基于挖掘的。但是所有这些手动方法都依赖于网络运营商的知识,并且它们也是耗时的。因此,Kim et al.已经提出了新的算法,以在规定的时间段内解决警报的根本原因 这些算法可以在互联网上的任何环境和拓扑上运行(Kim等人,2011年)。针对TCP/IP协议中告警相关方法的实现,提出了一种快速有效的解决方案在这个方向上,已经发展了一种过程,以通过结合两种提出的算法在短时间内解决警报的根本原因,即(i)警报着色算法-通过上述过程的实施,网络管理员更容易知道告警的根本原因。https://doi.org/10.1016/j.jksuci.2018.04.0051319-1578/©2018作者。制作和主办:Elsevier B.V.代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。制作和主办:Elsevier可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页:www.sciencedirect.comS.B. Das等人/沙特国王大学学报573本文的研究工作如下。第2节回顾了针对报警相关问题提出的不同方法,表1建议的报警关联方法的总结。包括一些有趣的研究挑战,为新手研究-呃。在第3节中,我们假设我们提出的算法SL.号文章方法缺点基于TCP/IP协议的端口地址问题的根本原因分析,并给出了流程图。我们提出的方法和现有的方法之间的详细比较在第4节中描述。最后,最后一节总结了评论和未来工作的范围。2. 相关工作1Kabiri和Ghorbani(2007),Rouvellout和Hart(1995)2Zheng和Qian(2005)3Lewis(1995),Steindera and Sethi(2004)基于规则的方法基于码书的方法需要专业知识来定义一组规则。需要专业知识来生成代码手册。建立数据库的解决方案需要专业知识,这是一个耗时的过程。早期的调查给出了网络管理系统中告警管理和故障管理的系统概述。Bouloutas等人(1994)提出了一个解决报警相关性和故障识别问题的通用框架,03 The Dog(2003)许多算法都需要很长的处理时间。通信网络。他们提出了两种算法,用于网络中的告警相关和故障管理这些算法在准确度、复杂度等方面都有较好的表现,同时也为研究人员探索了一个新的研究方向2009年,Wallin(2009)分析并提出了报警及其概念的标准定义下面讨论各种报警相关性方法基于规则:首先,网络运营商识别所有事件,如报警,警报,错误等;然后操作员找到每个事件的根本原因。由专家创建特定规则来处理每一个事件。这种方法的主要缺点是需要过多的知识来制定规则(Kim等人,2011年; Kabiri和Ghorbani,2007年)。基于代码本:这种方法将问题和症状之间的关联表示为矩阵。症状由代码表示,并且代码是二进制值的序列,即0(症状消失)和1(症状出现)。每个问题都可以通过码本来测量;因此,该技术在速度和精度方面是众所周知的技术。然而,码本的生成是耗时的(Kim等人,2011; Zheng和Qian,2005)。基于案例:在这种方法中,问题是基于存储在数据库中的解决方案来解决的。如果现有的问题与存储的问题不匹配,那么这种方法无法提供任何解决方案。 它还需要知识来构建解决方案,这是一个耗时的过程(Kim等人,2011; Lewis,1995; Steindera和Sethi,2004)。基于挖掘:通过几种挖掘算法检测频繁事件。但有时所提出的算法不能在规定的时间内给出事件的解决方案。我们已经在表1中给出了警报相关性的总结(Kim等人,2011; Vaarandi,2003)。Kim等人(2011年)提出了警报相关算法,可在短时间内解决根本原因。与其他算法相比,该算法在效率方面表现良好。在研究了五种不同的手动方法后,他们提出了警报消除和警报聚类来解决查找警报根本原因的问题。Kim等人(2011)提出了两种基于IP地址的算法。在软件定义网络(SDN)的情况下,各种工具,诸如veriflow( Khurshid 等人, 2013 )和报头空间分析( Kazemian 等人,2013)已经被提出用于验证网络的组件故障。Veriflow被认为是软件定义网络环境中的实时它实时检查网络不变量。它是位于软件定义网络控制器和网络设备之间的层。他们的实现工作不支持修改包头的动作,但支持开放流版本和IP转发 规则Kazemian等人 (2013 ) 介绍 了一种 称为报 头空间 分析(HSA)的通用框架。它找出了故障的各种原因,如可达性,转发和流量隔离的错误。这种分析的主要缺点是检测网络中的故障,而不是给出故障的详细原因。关键的挑战是在没有任何损失和人力的情况下更新网络本身。Liu等人(2013)引入了一种机制,即zUpdate,以找出网络中的组件故障。它有助于从初始流量到最终流量分发的无损过渡。zUpdate的主要目标是使网络免于拥塞。但是,zUpdate不支持更广泛的网络拓扑。然而,复杂网络的设计一直是研究者关注的焦点.Sung et al.(2008)提出了一种企业系统化设计方法。他们的方法包括三个步骤。 在第一步中,他们用网络范围的性能和安全性来建模运营目标。其次,他们将任务制定为一组优化问题。第三,他们开发了一种启发式算法来解决优化问题。他们考虑了两个关键方面VLAN设计和可达性控制等网络设计任务。然而,这种方法适用于单个网络。因此,如何访问网络数据并发现错误,对于企业网络来说是一个公开的挑战。Zheng(2013)提出了一种测试和调试网络的方法,称为自动测试包生成(ATPG)。它根据网络配置构造最小数量的数据包。这些数据包检测并定位网络故障。ATPG不能发现生存期短于每轮测试之间的时间的错误。因此,自动检测由于网络拓扑的变化而导致的网络的组件故障是一个主要挑战。Amin等人(2016)已经为混合SDN制定了一种新的方法。这检测转发设备和网络策略的接口,以提高网络效率方面的数据包交付率。他们提出了一种构造表示网络拓扑结构的图的算法,并利用图的差异来检测拓扑结构的可能变化。在检测到ACL策略违规后,它将消息发送给网络管理员,以便以更好的方式配置ACL策略。因此,它可能会增加他们提出的方法中的流量开销。我们已经考虑了不同的参数,如最小成本,流量开销的增加,对企业网络的支持和实时验证,以比较不同的现有方法与我们提出的算法,如表2所示。与上述缺点相比,我们的方法支持通过使用两种新的算法,如报警着色和报警着色,为所有类型的网络检测故障节点(S)。根据我们的观察,大多数解决根本原因分析问题的方法都是基于人工的,而且它们也很耗时。因此,我们提出了一种更简单的方法来分组报警●●●●574S.B. Das等人/沙特国王大学学报ðÞ1/4fg1/4fg1/4fg1/4fg公司简介表2我们提出的算法与现有方法的比较研究SL.号方法最小费用增加流量开销支持企业网络实时验证1Veriflow(Khurshid等人, 2013年度)没有––是的2报头空间分析(Kazemian等人, 2013年度)没有––没有3zUpdate(Liu等人, 2013年度)没有没有没有没有4系统设计(Sung等人,(2008年)没有–没有–5自动化测试(Zheng,2013)没有是的是的是的63元组和6元组网络策略(Amin等人,(2016年)没有是的没有没有7建议的方法(报警着色和报警显示)是的–是的是的与上述方法相比。在研究了用于解决根本原因分析的各种告警相关技术之后,发现了研究社区面临的以下挑战开发一个适用于所有操作系统的应用程序,每隔1 s就对网络进行一次监控,这是一个重大的挑战。一个主要的挑战是设计一个报警关联算法,通过考虑除IP和端口地址之外的任何其他因素来解决根本原因问题针对根本原因分析的问题,很难设计出改进的算法。最后,我们以图GV;E的形式给出了比较,其中V表示顶点集,E表示边集。3. 该方法在本节中,我们讨论了两种新的算法(报警着色和报警着色),用于通过示例查找报警的根本原因。3.1. 方法考虑,Aa1;a2;a3;. ;a n可以是由不同节点生成的警报集合。这些报警被输入到报警标准化,转换成通用格式。然后,报警着色算法根据端口地址为这些报警着色。这些彩色报警按报警报警处理算法基于颜色进行分组。现在,生成报告,这有助于管理员非常容易地找到警报的根本原因。我们已经在图1中显示了我们的分析,以找出警报的根本原因。在下一节中,我们详细解释了我们提出的算法。3.2. 解决根本原因问题的算法报警着色算法将输入作为端口地址和颜色的集合。对于每个报警,它根据端口Fig. 1. 一般概述。图二. 方法总结该算法,我们在图3中绘制了流程图。算法如下所述。设Q p1;p2;p3;. n是n个处理的端口地址集。地址.主要目标是分配最少数量的颜色,以区分不同的警报容易。然后,获取彩色报警作为报警排除算法的输入,该算法根据颜色对报警集进行分组,这有助于网络管理员了解报警的根本原因假设,P^fp1;p2;p3;. ;p ng是不同节点的端口地址的数目n,并且Cn f1; 2; 3;. . ;lg是输入的l个颜色的集合,并且PCp11;p22;. ;p n l是作为报警着色输出的接收彩色端口地址集算法输出集被输入到报警器算法;并且随后,G g1;g2;. gm是输出。我们已经提出了一个总结我们的算法图。 二、3.2.1. 报警着色此算法为相同的端口地址分配一种颜色,否则分配不同的颜色。为了更好地代表算法1报警着色1:输入:设i1/4;PC1/4;C1/ 4,以及K¼1; 1≤K≤l;l2N2:对于i^l,算法将K分配给pi。3:更新颜色集,即C为C/4 fKg。4:最后,将PC更新为PCpiK集合Q是Qpi。4:如果集合P是空的,则算法终止,否则,它从2到n扫描输入;n2N。6:如果Qg; 16i6n;n2Nn,则CPi2C。7:最后,PC^fPCg[fpi Kg。8:否则,算法将新的颜色,即K<$K<$1分配给不同的端口地址,即Ckipi <$-K。9:最终更新PC为PC¼ fPCg[fpiKg。第十章:输出:PC¼ fp1 1;p2 2;p3 3;. ;pn lg●●●S.B. Das等人/沙特国王大学学报5751/4fg¼¼f g[f g1/4f g^^图三. 流程图(报警着色)。3.2.2. 报警器该算法根据报警着色算法指定的颜色方案(如第3.2.1节所述)进行不同的分组。算法的流程图在图4中示出并且在下面进一步描述。设QC p1 1;p2 2;p3 3;. ;pn K是处理的彩色端口地址的数量。3.3. 样品运行让我们通过表3所示的样本数据集来说明我们提出的算法。 端口关闭,HTTP不可用,DNS不可访问等是网络中发生的不同类型的问题。假设,P1/4 f21; 23; 25; 53; 25; 53; 25g,C/f1; 2; 3; 4; 5; 6; 7g是端口地址的集合;算法2报警一曰:输入:设i1/4,G1/4和L1/4; 1≤L≤m;m2N2:对于i1,算法将pi K分配给组gL。3:如果PC是空的,那么算法终止,否则算法从2到n扫描输入;n2N。第四章:如果piK1/4 fQCg,则g=piK1/2G,更新QC为质量标准:第五章:否则,更新L值,L←L1,且pi K的群为g第六章:最后,将G更新为G G gL。7:从G中删除冗余组。第八章:输出:G¼ fg1;g2;g3;... ;gmg按顺序源端口53和25分别基于HTTP和DNS服务器(HTTP和DNS属于应用层)。两个端口,即23和25分别是25和53的目的地端口地址。在第一步,算法获取端口地址21并将颜色1分配给它。因此,颜色集变为C^f1g;K^ 1,并且接收到的颜色端口地址变为PC^f211g,因为PC是pi ci的组合。让我们假设Q是处理的端口地址的集合,表示Q21。它取下一个端口地址,即与集合Q的任何端口地址都不匹配的23。因此,通过将k的值从1更新为2,将新颜色分配给23然后设置C;PC和Q是更新为C1; 2;PC211; 232和Q21; 23。此外,它将25作为下一个端口地址,这与576S.B. Das等人/沙特国王大学学报¼GFG¼FG¼f1/4fg1/4fgfg <$fg <$fg公司简介<$fg <$fg <$fg¼FGG1/4fgg¼1/4f ggf公司简介公司简介<$fg<$f<$gfgggfg表3报警数据集示例。见图4。 流程图(报警器)。SeqSrc-IPSrc端口Dst-IPDst端口描述1IP121––端口关闭2IP223IP325端口关闭3IP325IP453HTTP不可用4IP453HTTP不可用5IP125––DNS无法访问6IP253––DNS关闭7IP125––HTTP关闭Q的任何元素。端口地址25通过更新被分配颜色3的值的K从2到3这结果在C1; 2; 3;PC 211; 232; 253和Q21; 23; 25。Simi-拉里为i = 4,的集将被修订作为C1; 2; 3; 4; PC211; 232; 253; 534和Q二十一、二十三、二十五、五十三由于端口地址53与fQg,其中新颜色4被分配给53。对于下一个输入即i 5,端口地址25与Q的一个现有元素匹配。所以它指定相同的颜色25,即,3.在这种情况下,仅设置PC和Q是改变作为PC¼f211; 232; 253; 534; 253g和Q1/4 f21; 23; 25; 53; 25g;哪里作为设置C 保持不变。随后(i6),因为端口地址53与一个现有的元素,P ,算法将相同的颜色4分配到53。在这种情况下,集合C保持不变,而集合PC和Q被改变为PC/f211; 232; 253; 534; 253; 534g,并且Q21; 23; 25; 53; 25; 53 .在下步骤,即我7,港口地址25与P并且分配相同的颜色3。在这种情况下,集合C保持不变,而其他集合被修改作为PC211; 232; 253; 534; 253; 534;253和Q21; 23; 25; 53; 25; 53; 25 . 下一个增量i从7到8,它检查集合P是否为空,其中该过程终止,最终输出为PC211;232; 253; 534; 253; 534; 253。设定的PC输入到报警处理算法。报警分组算法根据收到的颜色。初始时,i1;G1/ 4和L1/4; 1≤L≤m:。为i1,算法为211生成组g1,将G更新为G g1,将QC修改为QC211。然后(i = 2),报警扫描算法扫描来自集合PC的下一个输入。接收到的颜色232与QC的元素不匹配,因此算法通过将L的值从1更新为2来分配新的组。现在L的值被更新,即L^f1; 2g,232被分配给g2。最后,G和QC修改为G g1;g2QC =211; 232 . 对于i3,接收到的颜色253不等于任何设置的QC,因此算法分配新的组G3和修订的集为L1; 2; 3;Gg1;g2;g3和QC211; 232; 253 .与下一个增量,接收到的颜色534与QC的现有元素,并且随后新的组g4被分配有修改在所有的集作为L1; 2; 3; 4; Gg1; g2; g3; g4和QC211; 232; 253; 534. 因为我五,253的颜色与QC 的一个现有元素匹配为L值保持不变。然而,集合G和QC被修改为G g1;g2;g3;g4;g3和QC211; 232; 253; 534; 253。对于下一步骤,L值保持与接收到的颜色534相同。与 fQCg 的 一 个 现 有 元 素 相 同 , 其 他 集 合 被 修 改 为G<$fg1;g2;g3;g4;g3;g4g和QC<$f211; 232; 253; 534; 253; 534。再次在下一个增量中,即i 7,由于相同的颜色,L值保持相同,而集合G和QC改变为Gg1;g2;g3;g4;g3;g4;g3和QC211; 232; 253; 534;253; 534; 253.最后,进程停止递增,因为PC变得空虚。在终止之前,该算法移除S.B. Das等人/沙特国王大学学报5771/4fg1/4fg1/4fg1/4fg≤≤冗余元件从G这是获得Gg1;g2;g3;g4。我们在图1中用图解方法表示了集合G。 五、通过在如表2所述的数据集上顺序地实现两种算法,我们获得了颜色数量(l)、组(g)和节点(n)之间的有趣的分析关系,这在下面已经清楚地描述。定理1.设g;l和n之间的关系为gl≤n。证据1.设,有(M^fm1;m2;m3;. ;m ng)n个节点生成(A a1;a2;a3;. ;m)m个警报。报警着色算法颜色Lnumber的颜色,即C1; 2; 3;. ;l给不同的闹钟上色。报警报警算法将l个颜色分组,即B 1; 2;3;. ;g根据不同端口的接收颜色分为g组数地址. 我们用两个不同的步骤来证明关系步骤1:首先,我们将证明报警着色算法使用的颜色数(l)小于等于节点数(n),即l n。这里可能出现两种情况。情况-1:在最好的情况下,可能有一些节点的端口地址相同,那么算法使用的颜色数(l)将小于节点数(n)即,n.然后我
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- AA4MM开源软件:多建模与模拟耦合工具介绍
- Swagger实时生成器的探索与应用
- Swagger UI:Trunkit API 文档生成与交互指南
- 粉红色留言表单网页模板,简洁美观的HTML模板下载
- OWIN中间件集成BioID OAuth 2.0客户端指南
- 响应式黑色博客CSS模板及前端源码介绍
- Eclipse下使用AVR Dragon调试Arduino Uno ATmega328P项目
- UrlPerf-开源:简明性能测试器
- ConEmuPack 190623:Windows下的Linux Terminator式分屏工具
- 安卓系统工具:易语言开发的卸载预装软件工具更新
- Node.js 示例库:概念证明、测试与演示
- Wi-Fi红外发射器:NodeMCU版Alexa控制与实时反馈
- 易语言实现高效大文件字符串替换方法
- MATLAB光学仿真分析:波的干涉现象深入研究
- stdError中间件:简化服务器错误处理的工具
- Ruby环境下的Dynamiq客户端使用指南
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功