没有合适的资源?快使用搜索试试~ 我知道了~
制作和主办:Elsevier沙特国王大学学报SDN中的数据平面故障及其恢复技术:一个系统的文献综述Nauman Khana,b,Ban,Rosli bin Salleha,Ban,Anis Koubaac,Zahid Khanc,Muhammad Khurram Khand,Ihsan Aliaa马来西亚吉隆坡马来亚大学计算机科学信息技术学院计算机系统技术系b巴基斯坦KPK省Chakdara Dir Lower的Malakand大学计算机科学信息技术系c计算机和信息科学学院,苏丹王子大学,利雅得11586,沙特阿拉伯d沙特阿拉伯沙特国王大学信息保障卓越中心阿提奇莱因福奥文章历史记录:2022年8月7日收到2023年1月10日修订2023年2月1日接受2023年2月11日在线提供保留字:软件定义网络传统网络链路和交换机故障检测恢复保护人工智能A B S T R A C T软件定义网络(SDN)在企业和广域网中起着至关重要的作用。互联网上对严格的服务级别协议应用程序的需求日益增加,这要求网络在链路和交换机故障时具有可扩展性和弹性然而,缺乏对SDN数据平面故障恢复技术的系统这篇评论文章评估了SDN当前最先进的链路和交换机故障恢复解决方案。我们涵盖了传统核心网中故障的根本原因及其检测,并将当前SDN的故障恢复技术分为两类:传统方法和人工智能(AI)方法。基于AI的技术可以实现高效的故障恢复并提高服务质量。我们还考虑性能度量指标来评估和确定现有解决方案的局限性。该研究回顾了2010年至2021年的188篇论文,选择了70篇与我们工作高度相关的文章所有文章都是用英语写的我们的研究旨在收集大量证据,以帮助行业和学术研究人员解决SDN数据平面故障恢复解决方案的当前研究差距©2023由Elsevier B.V.代表沙特国王大学出版。这是一篇开放获取的文章,CC BY-NC-ND许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)。内容1.导言. 1772.SDN 177的背景和概述2.1.SDN架构1782.1.1.数据平面和基础设施层1782.1.2.控制平面和控制层1792.1.3.管理平面和应用层1792.2.动机1792.3.捐款1792.4.文章结构1803.相关工作。........................................................................................................................................................................................................................................................ 1804.研究方法1814.1.系统研究的研究过程4.1.1.研究问题1814.1.2.材料和方法181*通讯作者。电子邮件地址:wva190020@siswa.um.edu.my,khannauman52@gmail.com(N。Khan),Rosli_Salleh@um.edu.my(R.bin Salleh).沙特国王大学负责同行审查https://doi.org/10.1016/j.jksuci.2023.02.0011319-1578/©2023由Elsevier B. V.出版代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页:www.sciencedirect.comN. 作者:A.Koubaa等人沙特国王大学学报1775.讨论1825.1.第3层恢复和保护方法1845.2.第2层恢复方法1845.3.传统网络与SDN 1855.4.传统方法1865.4.1.故障检测1865.4.2.反应性办法1885.4.3.积极主动的做法1905.4.4.混合办法1935.5.AI接近1955.6.业绩指标1955.7.传统方法VS人工智能方法1965.8.测试台VS基于模拟的实验1986.未来的作品1997.结论和限制199竞争利益声明确认199参考文献2001. 介绍如今,互联网在数字化中发挥着主导作用。商业、健康、科学和社会网络的应用都在互联网上运行.全球所有数据中心的服务器都通过广域网连接。这需要持续的连接性,并依赖于通信基础设施的可用性和性能(Chiesa等人,2021年)。诸如服务器或链路/交换机故障之类的网络故障会导致访问服务的中断,并导致违反服务级别协议(SLA)。一项调查报告称,从2007年到2013年,28家云服务提供商在1,600小时的中断中遭受了约2.73亿美元的重大损失;这是由基础设施故障造成的(Gagnaire等人,2012年)。另一项研究报告记录了传统数据中心网络中每天约5.2%至40.8%的链路和设备故障(Gill等人, 2011年)。网络管理员、工程师和研究人员试图使网络和在网络上运行的服务可供访问,并具有故障恢复能力。网络可用性和可靠性的重要性因公司而异,因为确保网络和服务的高可用性(HA)和可靠性需要相当大的金 钱 成 本 。特 别 是 高 度 敏 感 的 网 络 , 如 军 事 网 络 、 Google 、Facebook、腾讯(QQ和微信)和阿里巴巴集团网络,以及它们的服务,都需要HA和可靠性。考虑到这些公司可以投入相当大的预算,世界上大多数人都在使用他们的应用程序和服务;他们的网络和服务中断可能导致巨大的收入损失。例如,在2021年10月8日,Facebook中断是由于其数据中心的链路故障,骨干互联网,他们的服务无法使用约8小时。据Facebook副总裁(R.MILLER,2021)称,此次故障的原因是“在计划的网络维护期间,发布了一个旨在评估全球骨干容量可用性的命令,无意中关闭了我们骨干网络中的所有连接,有效地断开了Facebook全球数据中心的连接这次中断导致Facebook(Metaverse)公司损失约230亿美元。因此,链路/交换机故障恢复机制的有效性和正确性是提高Internet接入和相应服务可访问性的关键。自20世纪50年代以来,这一主题得到了广泛的探讨(Dijkstra,1959年)。然而,这一概念需要不时地重新审视,以探索和设计新的网络解决方案和技术。快速故障恢复过程已经在软件定义网络(SDN)中的吞吐量、延迟和可用性方面改进了性能。在本文中,我们将故障恢复方法分为两部分,也就是说,传统的和基于AI的主要目的是确定AI在数据平面故障恢复领域的贡献,并在性能指标的基础上进行比较。2. SDN的背景和概述SDN以其灵活性、成本效益和适应性吸引了IT行业和学术界。由于其高带宽和应用服务的动态性,它已成为一种理想的解决方案该架构实现了网络控制平面和数据平面转发功能。控制器使用可编程逻辑,通过应用程序和网络服务抽象底层SDN已经克服了传统网络中的大多数限制。SDN的概念首先由Casado等人, 2007年)。它简化了网络的监控和配置。后来,来自斯坦福大学的研究小组开发了开放流(OF)协议(Greenberg等人,2005年)。它通过一个”南向应用程序编程接口(API)“与控制器和数据平面进行控制器利用OF在网络设备上安装转发规则(即,开关和路由器)。自2011年推出OF1.1版本最新版本是1.6,从1.0升级到1.4。新的功能已经被添加到OF协议的每个新版本中。除了控制平面和数据平面之外,SDN还有第三个平面,称为管理平面或应用平面。该平面通过北向API与控制器交互利用该平面,管理员和网络工程师可以部署他们的网络应用,例如负载均衡器和路由协议,这允许他们通过根据他们的需求控制数据平面的管理平面来SDN拥有来自领先IT、电信和工业供应商,如德国电信、谷歌、微软、Verizon和思科。他们共同发起了开放网络基金会,这是一个旨在加速2018年SDN技术他们中的一些人已经在软件定义的网络中部署了这些技术,例如Internet 2、全球网络创新环境和Google WAN-B4(Nunes等人, 2014年)。在国际电信联盟的电信标准化中N. 作者:A.Koubaa等人沙特国王大学学报178在SDN领域,一些组织已经开始制定SDN标准,特别是软件定义网络联合协调活动已被公认为管理SDN标准化工作。宽带论坛(BBF)通过服务创新和市场需求来研究SDN主题。BBF的目标是发布在多业务宽带网络中支持SDN的建议,包括混合环境,其中一些网络设备是SDN使能的,而一些是传统的(Greenberg等人,2005年)。SDN不仅限于企业或数据中心网络,它还对提高无线技术(如5G)的性能具有有益的影响。研究还显示了其在即将到来的6G技术中的足迹(Yu等人, 2020年)。在传统的网络中,第二层和第三层控制和数据平面的交换机(节点)是紧密耦合的。 SDN的概念已经将控制平面与数据平面分离。这种分离丰富了网络性能。链路和交换机故障检测、定位和恢复也是SDN的关键特征,其最小化了运营成本。通过SDN中的传统方式进行故障检测和恢复也克服了传统网络的局限性。此外,人工智能(AI)使重新融合成为可能,以塑造网络中的新地平线,并避免网络中的服务失真。本节重点介绍SDN架构。在讨论部分,分析了传统网络和SDN中通过传统方法和支持AI的应用程序的故障恢复技术。2.1. SDN架构SDN由三个逻辑层和三个解耦平面组成。SDN架构如图1所示,以便更好地理解每个平面或层。每一层都对网络有自己的贡献。SDN的灵活性已经通过将数据和控制平面解耦来实现(Khan等人,2020年)。我们在这里以自底向上的方式描述SDN架构2.1.1. 数据平面和基础架构层在SDN中,数据平面或基础设施层由网络中所有节点的联合组成它们是OF层2和层3Fig. 1. SDN三层架构。N. 作者:A.Koubaa等人沙特国王大学学报179交换机,路由器或接入点。在数据平面中,节点根据已经由控制器通过OF协议安装的流规则来转发数据业务。交换设备首先确定哪个转发规则适用于数据包,然后将其传递到下一跳。SDN分组转发可以基于附加特性,诸如TCP或UDP端口、虚拟局域网(VLAN)标签和入口交换机端口,而不是传统网络中使用的IP或MAC地址。将冗长向量用于转发决策增加了计算复杂度,导致SDN分组处理中的基本成本效率权衡(Xia等人,2014年)。OF协议具有交换机和控制器之间的交互协议。正如我们上面讨论的,OF协议使用了一个南向API.在初始阶段,网络中的所有交换机将它们的信息发送到控制器或控制层。如果发生故障,则应添加新路径并且旧的条目应该由网络的控制器移除(Hu等人, 2014年)。2.1.2. 控制平面和控制层传统网络本质上是分布式的,每个交换机或路由器都有自己的控制平面。相反,SDN具有用于所有节点的一个逻辑或物理控制平面。它位于在第二层,也就是控制层。控制器负责作出网络决策。它拥有整个网络的集中视图,通过不同的服务对其进行监控。存在许多控制器,但我 们 在 这 里 只 提 到 流 行 和 开 源 的 控 制 器 , 如 ONOS , ODL ,Floodlight,RYU,NOX和POX,它们主要用于研究。Ryu是典型的OF控制器。ONOS和ODL具有主导功能,并用于生产网络。在当今市场上,各种商用控制器,包括思科、华为、HP VAN SDN、NEC PF6800、VSC、NSX、Agile Controller和Windows Server 2016控制器具有广泛的功能(Khan等人,2020年)。网络设备和控制器之间的通信通过OF协议进行,该协议支持流消息。流消息可以是不同的类别(Belgaum等人,2020年)。控制器创建一个组并将流插入网络设备的组表中。 它还能够验证网络设备的状态,例如流、端口、队列、组和表。在网络设备和控制器之间发送回应请求和应答消息,以确定控制器是否活动。来自配置交换机的异步消息通过网络系统到达控制器,以从网络设备中删除流规则,配置和应用故障,以及端口打开/关闭。2.1.3. 管理平面和应用层管理平面使得网络对于用户来说是可编程的和灵活的。它位于控制层之上的应用层。在SDN中,用户根据自己的业务构建自己的应用程序并运行它们。应用程序通过北向API与控制器交互。应用程序的策略由控制器转换为流规则并安装在OF交换机上。应用程序可以编程实现策略,通过使用控制层提供的高级语言来操纵底层物理网络。在这方面,SDN提供了一个2.2. 动机SDN中数据平面上的故障恢复是网络可用性和可靠性的基本要求。在现有的综述文献中,缺乏系统性文献综述(SLR)。SLR循证方法用于确定主题-相关研究,并以可重复和无偏见的方式评估和说明所收集的关于重点子领域主题的证据(Kitchenham等人,2009年)。本SLR遵循预定方案的步骤进行研究选择和数据提取。最后,结果进行了综合,对比研究,并提出了可靠的证据的研究。在总结SDN研究的基础上,提出了一种数据平面故障检测和恢复策略的SLR。这篇文献综述确定并评估了SDN中的所有故障恢复方法。本SLR的主要目标是突出现有的贡献,数据平面故障恢复,并找到一个有效的恢复方法,考虑到性能矩阵(PF)。本SLR还打算检索尽可能多的与数据平面故障相关的文章。我们已经正式确定了最初的问题,以确定在SDN故障恢复相关的出版物的趋势使用“软件定义网络”和“SDN”进行关键词搜索,研究人员投入的这一趋势低于其他趋势。因此,我们需要探索SDN中这台单反相机给了我们在这一领域进一步探索的动力2.3. 贡献本SLR数据平面故障检测和恢复方案提出并分析了重要的文献成果,有助于理解SDN中数据平面故障恢复方法的当前研究。然而,过去在SDN和非SDN中的数据平面故障领域的综述没有系统地涵盖这些文章,并且缺乏基于多个矩阵,特别是PF矩阵的比较分析。因此,他们无法详细说明SDN和AI背景下的明确发现和未来方向。为了解决以前工作的缺点,本次审查的重大贡献如表1所示。对SDN领域中数据故障恢复的当前研究工作进行了全面的回顾,并对最近和最新的工作进行了严格的评估,特别是涵盖了过去10年,以确定所评论文章的缺点。图二、2010-2021年SDN故障恢复解决方案相关已发表文章的平均百分比●N. 作者:A.Koubaa等人沙特国王大学学报180表1与现有文献比较。会费因素(Chen等人,(丰塞卡和莫塔,(Yu等人,(Beschman等人,(Ali等人,(Chiesa等人,我们(2015年)(2017年)2018年)2019年度)2020年)2021年)工作文章选择过程XXXXXXU数据平面故障恢复UXXXXXU方法确定性能指标XXXXXXU传统网络中的链路和交换机故障分析XXXXXXU核心网络SDN与传统网络XXXXXXU数据平面故障恢复XXXXUXUSDN方法提取数据XXXXXXU仿真和试验台识别XXXXXXU网络规模分类XXXXUXU传统方法和人工智能方法的比较XXXXXXU比较文献并确定XXXXXXUPF矩阵本文为SDN的早期研究者提供了SDN的概述和背景.此SLR从现有文献中收集核心网络中链路和节点故障的数据相关分析,以更好地了解真实网络中故障的根本原因和症状,以及SDN中故障恢复的现有解决方案。比较传统网络和SDN,以确定SDN对未来网络的重要性。这SLR侧重于目前的故障恢复策略的分类,以及它们的改进和缺点,基于PF矩阵。我们使用流程图和通用AI模型来更好地理解SDN中故障恢复的不同方法。该综述的重要性在于,基于PF矩阵以无偏的方式。因此,本研究的描述性研究方法将有助于学术界和网络工程师了解基于AI的故障恢复解决方案的先前趋势和现状。在过程结束时确定了未来的研究方向,以在SDN中的AI背景下为未来的研究提出建议。2.4. 款组织本文的其余部分组织如下:在第3节中,重点讨论了现有的调查论文,特别是在SDN故障管理领域。第四节着重介绍了本研究的系统研究方法。第5节是关于综合现有的作品在一个连贯的和广泛的方法的讨论。第6节审查了基本调查结果和未来范围。第7节提供了结论和局限性。3. 相关工作计算机网络中的故障恢复过程已经随着技术的进步而改进,考虑到故障事件由于各种原因而发生在日常事务中。因此,研究人员和IT行业正试图改善它们,并实现服务可用性和网络可靠性。 (Chen等人,2015年; Rehman等人,2019)已经完成了研究,以提供有价值的洞察分析和分类,并检测网络中的故障,这会引起各种类型的问题和答案。网络中链路故障的根本原因是什么?哪些症状与什么类型的故障有关?并且给出了为通信网络开发人工智能容错模型或故障恢复过程的提示和路径故障管理过程给研究人员、网络工程师和从业人员带来了许多挑战。 随着SDN的普及和产业吸引力,研究人员已经彻底解决了SDN中的故障挑战,但随着技术的进步,AI和大数据分析等几个方面还需要改进。关于SDN中的容错性的调查由(Chen等人, 2015),以确定传统网络中的检测和恢复方法,并分析它们与SDN的联系。本研究还讨论了数据平面(链路/交换机)的故障检测和虽然该调查在出版方面限制了恢复解决方案,因为它是在2015年出版的,但它讨论了一些关于链路故障检测以及恢复和保护方法的论文。论文的选择不是基于标准。讨论了问题和未来的方向然而,没有提到链路和节点故障的根本原因以及纸张的关于SDN中的故障恢复的另一调查由(Wavelman等人, 2019年)。这项工作根据基于SDN层的架构(即,数据、控制和应用平面)。它全面概述了每个SDN平面上的故障或故障问题,并描述了相关的最新研究成果。文章还重点介绍了SDN故障恢复问题,并概述了未来的重要研究方向.然而,它没有提到论文选择和全面恢复技术的标准,例如数据平面中的混合和基于预测的恢复或故障恢复中的机器学习(ML)方法然而,它忽略了失败的根本原因有限数量的论文解决现有的恢复解决方案的问题已经提到。最近,文献(Ali等人, 2020年,他们就这一问题开展了工作。本文深入讨论了链路故障恢复及其方法,如恢复,保护,混合和ML恢复方法。然而,它没有提到多链路/节点故障恢复方法或基于预测的保护方法。在这项工作中,还缺少对传统网络中链路故障的根本原因的分析以及对它们与SDN的连接的分析相关的工作已经讨论了一般的技术,但他们没有比较的性能矩阵的文献根据我们最好的知识和研究,没有与数据平面故障相关的SLR,并且已经进行了恢复的●●●●●●●●●N. 作者:A.Koubaa等人沙特国王大学学报181●以前的调查的另一个缺点是,他们没有涵盖SDN中数据平面的大部分故障恢复解决方案,也忽略了传统的恢复技术和基于AI的故障恢复解决方案的比较。本SLR的目的是阐明网络可靠性和可用性的最重要支柱之一,它位于网络弹性的主要领域。这项新研究将为SDN中网络的故障恢复提供很好的见解。故障的原因及其症状,以及SDN覆盖类型的最新发展不同技术的失败。4. 研究方法任何系统性文献综述的主要目标都应该是全面分析与研究主题和关注点收集相关根据(Kitchenham等人, 2009年),他为SLR文献提供了许多系统性方法,每一个系统性综述都应该遵循特定的策略和相关的方法,作为即将到来的SLR的标准。本文的目标是使用SLR策略,这需要结合广泛使用的工作和特定数据平面故障恢复的结论,并通过使用PF矩阵突出差距来提供可比的即兴创作。4.1. 系统研究这项调查分三个阶段进行。第一和第二阶段包括文章选择过程,第三阶段是数据综合,如讨论部分所述。阶段1:本文中的选择过程遵循PRISMA方法,如图3所示。在研究问题的基础上,我们制作了字符串,并从各种数据库和初步检索中获得了结果。在收集了所有来源的文章之后。从多个来源发现了相同的文件,这造成了重复。在此阶段,我们删除了多个副本,并将其转换为单个表单。第二阶段:通过对故障恢复技术进行全面分类,全面完成标题、摘要和关键词的分析、冗余的去除和检索过程,以保证本次调查的完整性大多数文章被筛选出,因为它们的标题不适用于确定标准,或者摘要与本次调查中考虑的内容无关。第三阶段:我们获得了188篇高度相关的论文。第三步是全文筛选,这为我们提供了与本次调查完全相关的主题。最后一组70篇论文是根据相关性选出的。4.1.1. 研究问题虽然对特定领域的兴趣通常是研究操作的催化剂,但对主题的理解有助于开发一个好的研究问题。问题的出现是因为在一个领域或研究领域存在明显的知识差距。研究问题已正式为本次调查,不同的链路和节点故障及其恢复方法的分析。以下是我们在表2中准备的研究问题,并希望通过此SLR解决4.1.2. 材料和方法搜索数据库和关键字组合在如表3所示的学术数据库中,以及在本SLR中使用的如表4所示的检索关键字中,布尔表达式用于链接关键字以进行数据提取。通过组合术语,布尔运算符通过使用术语AND和OR来扩展或集中搜索查询表5显示了该SLR中使用的布尔值。● 包含和排除系统性文献综述它们主要是在决定研究问题后和进行检索前预先确定的,但范围检索可能是选择相关入选/排除标准所必需的。可以使用各种方面来将这些标准定义为如图所示的纳入或排除标准。图三. 基于Prisma方法的文章选择过程。●●●N. 作者:A.Koubaa等人沙特国王大学学报182表2关于SLR的研究问题研究问题动机核心网络故障的根本原因和症状是什么?识别故障原因及其类型传统网络中的故障恢复方法有哪些?故障恢复对网络有何益处?在不同的层中有不同的故障恢复协议,这有助于在任何故障事件期间使网络可靠和可用。SDN克服了传统网络的哪些局限性?SDN克服了传统的网络问题,如Opex和Copex,性能更好,高效,使网络敏捷和灵活的创新。灵活性和可编程的因素已经引起了学术界的关注。SDN中现有的链路/节点故障检测技术有哪些?SDN中数据平面故障恢复的传统方法和算法是什么AI在SDN数据面故障管理方面的研究现状如何SDN中数据平面故障恢复方法考虑的参数和指标是什么识别现有的故障检测方法许多框架和方法,以确保在SDN中的快速恢复进行审查和比较,以确定AI的贡献。确定故障恢复解决方案评估表3数据库来源搜索结果和关键字。表6论文审查的包容性和排他性标准。排除标准序列号数字数据库关键词DB-1IEEE摘要、标题、关键词DB-2 ACM摘要、标题、关键字DB-3 Scopus摘要、标题、关键词DB-5 Science direct摘要、标题、关键词DB-6 Springer摘要、标题、关键词在传统网络和SDN中,研究的重点是链路和节点故障和恢复。研究重点是传统网络和SDN中的链路和节点故障及其恢复。涉及其他问题涉及其他问题DB-7 Web of science摘要、标题、关键词用英语写的文章被认为是。用其他语言语言不包括在内。表4搜索字符串。S.No批次1 = B1批次2 = B21软件定义网络故障恢复2Sdn复原力3容错4故障管理表5字符串的组合S.没有字符串组合1(1,B1)或(2,B1)2(1,B1)或(2,B1)与(1,B2)3(1,B1)或(2,B1)和(2,B2)4(1,B1)或(2,B1)和(3,B2)5(1,B1)或(2,B1)和(4,B2)6(1,B1)或(2,B1)和(4,B2)学术和同行评议的期刊文章应予以考虑。应考虑具有良好声誉的期刊或会议论文。未发表的文章不包括在内。在表6中。我们制定了一系列合格的研究,因为对于任何系统评价来说,确保仅考虑与研究问题相关的结果至关重要图4显示,根据我们在上面选择的标准,我们已经覆盖了56%的期刊论文和44%的会议论文5. 讨论故障识别、检测和恢复方法是计算机网络领域的一个重要研究课题和可用性。在SDN领域已经进行了关于容错解决方案的调查,但是与传统的网络故障情况相比,它们缺乏映射、它们的识别以及它们在SDN中如何解决。本文的目的是确定图四、本SLR涵盖的期刊和会议论文的百分比传统网络中链路和节点故障的根本原因及其在传统网络和SDN中的恢复方法。此外,本文是未来研究人员在SDN领域更好地理解AI容错解决方案并为未来网络提出更好解决方案的起点。它在故障恢复期间提供了灵活的方法。今天,在建筑物中部署网络被认为是小规模的。然而,这可以扩展到多个网络,例如中等规模的网络,并且在多个建筑物连接之后扩展到大规模的网络在过去的十年中,研究人员已经研究并提出了针对这些网络规模的容错解决方案。N. 作者:A.Koubaa等人沙特国王大学学报183在表8中,通过单链路或多链路故障恢复解决方案的性能度量,总结了该SLR中现有文献相关反应式方法在SDN研究的起步阶段,一位作者提出了一种基于路由器的鲁棒网络。它支持从交换机或数据平面故障它在当前网络的全局网络视图上运行有效的所提出的框架具有五个属性:快速恢复,可扩展性,多路径路由,拓扑独立性,和单控制器。(Kim等人, 2012年),提出并分析了第一个用于处理大规模多链路故障的容错解决方案,并通过OF提高了网络的可扩展性1.0 版本.然而,恢复时间较长,导致网络中的端到端延迟,因此本机检测LLDP在这项工作中被用于克服端到端延迟。在(Ramos等人,2013),旨在通过分组编码机制来提高可扩展性并最小化分组丢失,其中分组被错误地标记。为了提高收敛性和减少端到端延迟,Kim等人的作者。(2013)提出了一个有效决策的认知控制模型。主要的限制是计算开销。在小型网络中的性能会很好。在大规模的网络中会退化。 (Nguyen等人,2013 b)已经研究了故障恢复期间的收敛时间,并且提出了一种用于克服该问题的方法,该方法最小化了大规模网络中的多个链路故障期间的收敛时间。SD-WAN包含通过域间链路连接的多个域。因此,对于端到端交付,域间链路连接至关重要。(LI等人,2014)提出了一种用于域间链路汇聚的快速重路由(FRR)方案。该方案最大限度地减少了整体数据包丢失和收敛时间。然而,这种方法的主要限制是计算开销。5G使用的案例Said et al. (2017)也已经解决了利用自动隧道重建和(ii)按需隧道重建来处理节点故障,从而提高了可靠性。在(Mohan等人, 2017年)。1. 核心网络故障的根本原因和症状是什么传统的网络设备仍然存在于互联网主干上,因为主干上的设备无法被替换,因为SDN与传统网络相比还不成熟。相应地,我们以图5所示的核心网中的传输网络设备和链路故障分类的条件和原因为例,分析其在SDN中的恢复方法。(Gonzalez和Helvik,2012)简要分析了来自操作网络日志的链路和节点故障。作者揭示了网络中第一个也是最常见的故障发生在平均恢复时间较长的长途线路上,这与链路的停机时间有关。第二个发生在介质链路中,例如在一个网络中的不同服务器机房之间。第三种情况发生在网络中的一个小链路上,这主要是在网络的一个操作室中的路由器或交换机之间。网络节点的故障是网络中最不常见的故障。主干网络需要非常稳定。如果网络组件的概率行为是已知的,则可以在操作之前预测所提供的可用性。本研究的目的是提供在网络系统中的故障和恢复操作的数据。检查核心网操作日志以获得交换机和链路的故障和停机时间的时间分布。网络设备根据它们在网络中的角色进行分类。在危险函数的基础上讨论了这种差异。每个网络组件的参数都是可用的,并提供了一个详细的见解,可用于可靠性预测和研究。图五.传统核心网络中的故障分类(Markopoulou等人,2008年)。在(Markopoulou等人, 2008),这项工作还调查了操作日志。在此基础上,他们对不同类型的故障症状进行了分类并进行了考虑。在维护时间段期间,链路和路由器或交换机停机,在此期间,管理员更新路由器或交换机的固件由于网络中的高冗余,管理员将流量转移到网络中的冗余链路和交换机这被称为链路和交换机故障,但网络融合所面临的问题是一个不可预见的问题。因此,对于容错网络模型,故障和症状的分类是重要的。下面给出了数据平面上的故障症状在(Gill等人,2011年),作者调查了失败的原因和网络可用性的影响。作者在分析数据中心网络操作日志后指出,相 应 地 , 本 文 对 传 统 的 网 络 设 备 故 障 分 类 进 行 了 映 射 在(Gonzalez和Helvik,2012)中,作者分析了操作网络Syslog信息,并根据这些信息表征了与网络中的链路和节点相关的不同故障。从调查结果来看,所有故障中有20%发生在计划外故障的计划维护工作中,近30%涉及多个连接,最常见的是由路由器相关和光学设备相关问题引起的,70%的总影响是一段时间内的单个链路。我们的故障分类表明了Sprint IP骨干中问题的种类和范围。为了实现HA,尽管有各种故障源,如硬件,软件和人为故障,运营商必须集中精力纠正网络中不同的链路故障被描述为故障总数和总停机时间。与设备故障相比,网络连接故障是链路故障的最常见原因,其次是硬件和软件问题。与硬件和网络连接问题相比,软件故障导致的停机时间要少得多。这表明,软件问题,而不是严重的网络连接和硬件相关问题,导致周期性的,短暂的故障(例如,软件错误产生错误的链接断开通知)。对以下故障类型的分析使我们了解了最重要和最不重要的故障类型网络中交换机和链路故障的根本原因如图所示。 六、N. 作者:A.Koubaa等人沙特国王大学学报184见图6。 传统核心网中交换机和链路故障的根本原因。变更事件:在网络升级过程中,公司需要根据不同的理由部署或升级交换机,例如技术的进步和供应商公司的支持终止。它会导致中断,有时还会导致意外故障,例如新交换机在现有网络中的兼容性因其位置而受到影响。特定设备时间的操作系统重启也会导致网络中持续时间较短的多个链路故障更改事件类型故障影响第1层到第3层TCP-IP级设备。硬件:分布层和核心层交换机的供电问题在数据中心有考虑因此,电源冗余由于其在网络中的作用而在交换机中使用。然而,也存在由于外部因素而耗尽两个电源的可能性,例如来自电网的电力波动和降低的冷却系统条件使得开关温度高。因此,热量会导致开关崩溃如果网络团队不承认,最后可能会导致整个网络瘫痪。最近,英国的热浪导致谷歌,微软的交换机关闭,团队已经强行关闭交换机以避免重大破坏软件:Bios更新和IOS热修复程序也是故障原因,但从现有研究分析,与网络中的硬件故障相比,软件相关故障的严重程度较低配置方式:故障恢复和设备的配置也会导致故障并导致服务不可用,例如在网络中的分布层将备用交换机配置为备用交换机不正确意味着由于人为错误而将交换机接口配置为错误的IP地址。在两个站点之间的VPN隧道中,新对等设备之间的其他配置不正确2. 传统网络中的二层和三层故障恢复方法是什么?在传统网络中,网络设备的两个主要组件是数据平面和控制平面,它们在设备内部紧密耦合链路和节点故障收敛的整个故障恢复周期见图7。它显示了恢复周期阶段的响应时间。5.1. 第3层恢复和保护方法网络中的每个设备通过使用在控制平面中运行的分布式协议来发现网络拓扑。数据平面的任务是转发或丢弃传入的数据包根据控制平面的指令。分布式路由协议(如OSPF、IS-IS和RIP)由组织在其路由设备中实现,目的是在同一自治系统内发送和接收路由信息,路由设备最终将使用这些路由信息来实现以下目的:见图7。 交换或链路故障恢复周期阶段。病房数据包。这些路由设备将更新它们与其他路由设备的链路中的每一个,使得每个单独的路由设备将具有更新的链路信息。用于计算路由表的每个路由设备都利用该信息。在链路/节点故障的情况下,这些协议将向所有交换机/路由器发送关于故障链路的更新,以调整路由集。热备份路由器协议和虚拟路由器冗余协议用于交换机/路由器故障转移收敛,但它们依赖于故障检测。在企业网络中,它们专门部署在分布式和核心层路由器上。选择路由协议的一个关键方面是一组路由设备达到收敛状态的速度。通常,传统网络中的收敛时间随着拓扑规模的增加而增加,因为关于故障链路或交换机/路由器的信息需要传播到所有路由设备。也就是说,收敛时间随传播和拓扑尺度线性增加除了传播时间外,路由收敛时间也受到故障检测时间的影响。EIGRP被用作在网络中的链路和交换机故障的情况下的保护方法,EIGRP还在交换机处为辅助路径制作路由表,在这种情况下,它因此,EIGRP在链路失效时的收敛性优于其他传统协议。5.2. 第二层恢复方法在数据链路层中,网络交换机通过层发现协议发现网络上的拓扑特别地,生成树协议(STP)第2层交换机不仅用于避免网络中的环路,而且用于基于检测的恢复。如果网络链路因任何原因出现故障,交换机将接收端口断开的交换机在这种情况下,交换机会打开阻塞的端口,使其关闭以避免转发环路,但端口至少会打开50 s。第2层网络中的收敛时间也取决于拓扑规模,因为网络层收敛是由于其分布式性质。●●●●N. 作者:A.Koubaa等人沙特国王大学学报1855.3. 传统网络vs SDN3. SDN克服了传统网络的哪些局限性在表7中,我们对传统网络和SDN的比较进行了简要概述,下面我们将为读者简要描述可编程性:传统网络是不可编程的;它们具有内置的特定路由协议。黑盒上运行的是供应商专用协议因此,它们变得僵化,不允许其他各方参与部署自己的协议。这种模式可能会限制计算机网络的创新。SDN通过解耦的控制平面和数据平面克服了这一限制,使网络更加动态和灵活。研究人员和网络工程师已经根据自己的需求,通过应用层为创新和部署自己的应用奠定了基础。我们也可以从上面的图中看到。 1、研究人员如何通过SDN为网络工作领域做出贡献。资本支出和运营支出:在传统网络中,维护需要维护团队应该是特定的供应商,因为在数据中心机房安装路由器和交换机的公司正在获得安装和每年维护服务。然而,设备的部署和配置是耗时的。在SND中,由于其集中式控制平面架构,跨网络部署服务可以节省时间 其中一篇与通过SDN在多个域之间的5G网络中部署服务相关的文章证明了服务部署的容易性和服务部署时间从几天减少到几分钟(Baranda等人,2018年)。故障恢复:在传统网络中,故障收敛需要很长时间,从几秒到几分钟。这取决于拓扑结构和网络设备容量。例如,在第2层拓扑中,STP会阻塞拓扑中的一条链路,从而避免转发环路。它也被用作块链接,备份,但收敛需要相当长的时间,这损害了服务质量QoS/QoE。第三层的收敛概念是相同的,每种路由协议都有自己的特点,但有一点是共同的。第一是分布控制平面的性质,第二是拓扑依赖性。相比之下,SDN具有集中式架构,并且没有拓扑依赖性。数据平面上的故障聚集依赖于集中式控制器。故障排除:传统网络在故障排除过程中具有高度的复杂性。原因是传统网络中的大多数中断都是由于安全策略的不正确实施而发生的,由于其分布式特性,这会在网络中造成中断。网络工程师将首先确定问题发生的位置。如果它可能是在一些设备接口上,其中不正确的政策是implement- mented或VLAN泄漏或黑洞。相反,SDN具有集中式架构,因此网络工程师或管理员将与控制器一起工作此外,许多验证工具可用于在实施之前检查网络配置,并且配置已经被纠正或者它已经在网络中造成中断如果它产生了黑洞、漏洞和其他错误,它可以阻止规则。 SDN对网络验证做出了巨大贡献,例如Veriflow(Khurshid et al.,2013)和Delta-net(Horn等人, 2017年)。性能:传统网络中的数据流量传输网络中没有处理流量行为和拓扑的自动化。网络中的拥塞和静默丢包成为性能的障碍SDN在开放流交换机上安装流设置后,通过其集中式架构克服了这些障碍。由于基础设施层的开放流交换机只负责转发数据包,因此数据包的传输速度比传统设备快得多。控制器根据业务行为和网络拓扑的变化,采用研究人员为提高网络性能做出了巨大贡献。能源:传统网络的分布式特性导致高能耗,因为每个路由器/交换机都有一个单独的控制平面。能源占ICT服务提供商运营支出的10%以上(见同上)。在最近的一项研究(Koronen et al.,2
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功