没有合适的资源?快使用搜索试试~ 我知道了~
制作和主办:Elsevier沙特国王大学学报云计算中的容错技术综述PritiKumari,Parmeet Kaur印度诺伊达Jaypee信息技术学院计算机科学信息技术系阿提奇莱因福奥文章历史记录:2018年6月22日收到2018年8月24日修订2018年9月25日接受在线发售2018年保留字:云计算容错数据中心网络拓扑A B S T R A C T云计算带来了信息技术交付模式从产品到服务的转变。它使各种软件、平台和基础设施资源作为可扩展的服务在互联网上按需提供。然而,云计算服务的性能受到阻碍,因为其固有的脆弱性,故障,由于他们的运作规模只有当云服务提供商有效地处理可靠性、可用性和吞吐量等与性能相关的问题时,才有可能最大限度地利用云计算服务因此,容错成为实现云计算高性能的关键要求。本文对云计算中与容错相关的问题进行了全面的概述,重点介绍了云计算中的重要概念、架构细节以及最新的技术和方法。我们的目标是提供深入了解现有的容错方法,以及需要克服的挑战。该调查列举了一些有前途的技术,可用于有效的解决方案,并确定了在这一领域的重要研究方向©2018作者制作和主办:Elsevier B.V.代表沙特国王大学这是一CC BY-NC-ND许可下的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。内容1.导言. 11602.云计算的背景2.1.云计算基础设施11612.2.云部署模型11612.3.云服务模型11623.分布式系统中的容错方法3.1.分布式计算环境中的容错11664.云计算中的容错方法4.1.系统型号11674.2.主动方法11684.3.反应性方法11694.4.用于FT 1170的其他杂项方法4.5.在各种基于云的应用程序和相关应用程序中集成容错5.未来研究方向11735.1.深度学习11735.2.区块链11735.3.分布式重复数据删除系统11745.4.关于业绩问题的强调1174*通讯作者。电子邮件地址:parmeet. jiit.ac.in(P。Kaur)。沙特国王大学负责同行审查https://doi.org/10.1016/j.jksuci.2018.09.0211319-1578/©2018作者。制作和主办:Elsevier B.V.代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页:www.sciencedirect.com1160P. 库马里山口 Kaur/Journal of King Saud University- Computer and Information Sciences 33(2021)1159- 11766.结论1174参考文献11741. 介绍云计算指的是在远程位置访问、配置和操纵资源(诸如软件和硬件)(Patidar等人, 2012年)。 Buyya等人云是一种并行和分布式系统,包含一组互连和虚拟化的计算机,这些计算机基于通过服务提供商和消费者之间的协商建立的服务级别协议动态地提供和呈现为一个或多个统一的计算资源。根据美国美国国家标准与技术研究院(NIST)的定义:“云计算是一种模型,用于实现对可配置计算资源(例如服务器、网络、存储、服务和应用程序)的共享池的方便、按需网络访问,这些资源可以通过最少的管理工作或服务提供商交互快速配置和发布”(Mell和Grance,2011年云计算以服务的形式向最终用户按需提供各种资源。它使企业和用户能够使用应用程序,而无需将它们安装在物理机器上,并允许通过Internet访问所需的资源。它提供了高性能、按需付费、连接性、交互性、可靠性、易于编程性、效率、可扩展性、大量数据的管理以及将IT从产品转换为服务的弹性等功能(Savu,2011; Bokhari等人, 2016年,如图所示。1 .一、云计算作为一种快速发展的技术,越来越多地被用于托管许多商业或企业应用。然而,广泛使用基于云的服务来托管业务或企业应用导致服务提供商和用户的服务可靠性和可用性问题(Gokhroo等人,2017年; Nazari Cheraghlou等人, 2016年)。这些问题是云计算所固有的,因为它具有高度分布式的特性、资源的异构性和大规模的操作。然而,在云环境中可能发生几种类型的故障,导致故障和性能下降。断层的主要类型(Amin等人,2015; Saikia和Devi,2014; Essa,2016)列出如下:网络故障:由于云计算资源是通过网络(互联网)访问的,因此云计算故障的主要原因是网络故障。这些故障可能由于网络中的分区、分组丢失或损坏、拥塞、目的地节点或链路的故障等而发生物理故障:这些故障主要发生在硬件资源中,例如CPU、内存、存储器中的故障、电源故障等。流程故障:由于资源短缺、软件缺陷、处理能力不足等原因,流程可能出现故障。服务到期故障:如果一个资源故障导致系统崩溃或系统关闭。然而,分布式计算以及云计算的特征在于部分故障的概念。故障可能发生在任何组成节点、过程或网络组件中。这会导致部分故障,从而导致性能下降,而不是完全崩溃。虽然这会导致系统的健壮性和可靠性,但对于高性能计算,应该通过适当的容错机制容错使系统能够服务于请求,即使某些组件不能正常工作(Gokhroo等人,2017; Charity and Hua,2016)。容错(FT)是指一个系统在发生故障时仍能继续执行其预期功能的能力换句话说,FT与可靠性、成功操作和无故障有关基于FT的系统应该能够检查特定软件或硬件组件的故障,电源故障或其他各种意外逆境,并且仍然符合其规范(Dubrova,2008)。该调查作出了以下贡献:这是一个全面的研究容错云计算系统。它讨论了云环境中故障、错误和失败的分类及其可能的原因。与用于确保云系统中的容错的现有方法一起,还描述了用于包括移动计算系统的各种分布式系统的相同方法。因此,提出了对问题及其挑战的全面看法。探讨了云计算系统中的容错方法对数据中心底层网络拓扑的依赖性该调查讨论了云系统数据中心中最常见的网络拓扑,以及容错方法如何在其实施中利用相同的拓扑。Fig. 1. 云计算●●●●●●●P. 库马里山口 Kaur/Journal of King Saud University- Computer and Information Sciences 33(2021)1159-11761161图二.云计算架构。该调查列出了许多基于云的杂项问题,容错方法已与之集成。我们特别强调容错与云安全的集成。一些有前途的技术,如深度学习和区块链,可以有效地用于这一领域进行了讨论。基于对现有挑战和解决方案的理解,列举了几个研究方向调查报告的其余部分分类如下:第2节概述了云计算环境、部署模型和服务堆栈。在第三节中,介绍了分布式系统中使用的传统容错方法。第4讨论了云计算环境中现有的容错方法第五是未来研究的方向。最后,第6节提出了结论性意见。2. 云计算云计算已经从各种计算研究领域的努力中发展而来,例如分布式计算、网格计算、虚拟化技术和SOA(面向服务的体系结构)。因此,它吸收了他们的特点,先进性,以及局限性。本节从五个方面描述云计算:(a)基本概念(b)云组件(c)云基础架构(d)云部署模型(e)云服务堆栈,如图所示。 二、2.1. 云计算基础设施云计算基础设施包括为用户提供云计算资源和服务所需的计算机、存储设备、网络设施和其他相关组件。这些硬件组件大多位于企业数据中心内。这些包括多核服务器、固态驱动器和硬盘驱动器,提供稳定的存储和网络设备,如防火墙、交换机和路由器;所有这些都是大规模的。除了这些硬件组件之外,支持云服务模型的软件组件(例如虚拟化软件)也被称为云计算基础设施。虚拟化软件提供云资源的抽象,通常使用API(应用程序接口)或其他命令行和/或图形接口向用户提供这些资源。由云服务提供商(CSP)托管的虚拟化资源通常通过互联网(有时通过任何其他网络)交付给用户。云计算资源通常以共享和基于多租户的方式作为服务提供给用户。基于多租户的方法被亚马逊网络服务(AWS)和/或谷歌云平台等主要CSP使用。这种方法用于在多个应用程序和租户(企业、组织等)之间以具有成本效益且安全的方式共享资源使用云。虚拟化软件可用于确保租户之间的隔离典型的云基础设施包括客户端、服务器、应用程序和其他组件。另一个云计算组件是分布式文件系统(DFS),如Google文件系统(GFS)和/或Hadoop分布式文件系统(HDFS),主要用于存储数据以对象或块的形式存在于磁盘上。这些文件系统将存储管理与实际物理存储分离,从而确保存储的可伸缩性。因此,云计算基础设施广泛地包括(Singh等人, 2016年),其中:服务器虚拟化-抽象物理组件(如服务器、存储和网络)并将其作为逻辑资源提供的技术。存储网络-提供物理服务器和存储之间的互连。管理-用于配置、管理和监控云基础设施的各种软件,包括服务器、网络和存储设备。安全性● 备份和恢复服务。2.2. 云部署模型云部署模型基于云服务预期使用的动机和环境。部署模式的选择决定了所产生的成本、功耗●●●●●●●●●南纬1162号库马里山口 Kaur/Journal of King Saud University- Computer and Information Sciences 33(2021)1159- 1176图三. 云服务交付模式。资源消耗和其他资本支出(Rendezvous等人, 2009年)。云环境中最常用的部署模型是公共云、私有云、社区云和混合云。公共云:公共云允许公众访问企业提供商提供的系统和服务。它提供了灵活性、可扩展性、位置独立性和非常低的成本,因为通常使用多租户(Patidar等人,2012; Savu,2011; Singh等人,2016年;雷诺例如,2009年)。资源是从远程第三方提供商按需动态提供的,该提供商使用多租户方法提供资源。私有云:私有云在特定组织内使用,即,云资源和服务可以在组织内部被访问该模型确保了高应用程序和数据安全性和隐私性(Patidar等人,2012; NazariCheraghlou等人,2016; Singh等人,2016年; Rendezvous等人, 2009年)。社区云:该模型由各种企业/组织同时使用,并帮助包含公共参与(例如安全必要性,任务和合规性考虑等)的特定社区/社会。这种模式可以由社区内的一个或多个组织或/和第三方运营、拥有和管理。(Mell and Grance,2011;Savu,2011;Zissis and Lekkas,2012)。混合云:混合云是公共云和私有云的联盟。在此云部署中,关键事件(例如 需要安全操作的事件)使用私有云服务来完成,非关键事件使用公共云来实现(Savu,2011; Roungeet al., 2009年)。公共云最适合组织希望使用聊天和视频会议等协作服务但本地没有足够的IT资源或基础设施。相反,如果严格的安全性和隐私是高优先级的问题,则应使用私有部署模型。另一方面,对于拥有大型IT基础设施并正在扩展其功能的组织,应该选择混合部署模型。2.3. 云服务模式尽管云计算近年来已经高度发展,但服务仍然分为三种主要的服务模型(Patidar等人,2012; Singh等人,2016年; Rendezvous等人,2009年)。基本服务模式如图所示。3 .第三章。软件即服务(SaaS):在该模型中,软件应用程序由云服务提供商 以 服 务 的 形 式 提 供 给 消 费 者 / 最 终 用 户 ( Patidar 等 人 ,2012;Bokhari等人,2016年; Rendezvous等人, 2009年)。作为服务交付给客户端的应用程序消除了在用户计算机上安装和执行云应用程序的需要例如,网络会议服务、电子邮件应用程序、社交媒体平台等。SaaS提供商的名单是亚马逊AWS,谷歌计算引擎 , 微 软 Azure , IBM SmartCloud Enterprise , CloudStack ,OpenStack , Open-Nebula , CloudForge , Citrix , Qstack 等(https://www. datamation.com,云计算,50家领先的SaaS公司。html)。平台即服务(Paas):该模型提供了一个在云中开发、运行、测试和管理应用程序的平台(Bokhari等人,2016年; Rendezvous等人,2009年; Abdelfattah等人,2017年)。用户可以从CSP租用具有软件栈的环境,并将其用于自定义应用程序开发。PaaS提供商的列表包括Acquia Cloud、Amazon AWS、App Agile、Apprenda 、 AppScale 、 Bluemix 、 Cloud 66 、 Cloudways 等(https://stackify.com/top-paas-providers/)。●●●●●●P. 库马里山口 考尔/沙特国王大学学报-计算机与信息科学33(2021)1159-11761163见图4。故障的发生图五. 故障分类见图6。 错误的分类。云结构即服务(IaaS):IaaS模型提供访问某些主要资源的便利,物理机、存储、网络、服务器、云上的虚拟机等(Bokhari等人,2016; Saikia和Devi,2014; Abdelfattah等人,2017年)。IaaS提供商提供动态虚拟机配置和按需存储设施等服务。名单●小行星1164库马里山口 Kaur/Journal of King Saud University- Computer and Information Sciences 33(2021)1159- 1176见图7。 故障分类见图8。容错方法的分类。SaaS提供商的主要竞争对手是Salesforce,Microsoft,AmazonWeb Services,Slack,Zendesk,GitHub,Oracle,Cisco等(https://stackify. com/top-iaas-providers/)。任何东西即服务(XaaS):XaaS是另一种服务模型,可以是任何东西或一切作为服务。云系统能够维护大量资源,以满足使用安全即服务、身份即服务、通信即服务的个人、粒度和特定需求。即服务、DaaS(数据库即服务)或策略即服务等(Singh等人, 2016年)。3. 分布式系统中的容错方法容错对于系统至关重要,即使在组件故障或一个或多个故障的情况下,系统也可以提供所需的服务(Charity和Hua,2016年; Valle●P. 库马里山口 考尔/沙特国王大学学报-计算机与信息科学33(2021)1159-11761165表1对反应式容错机制进行了描述.表3云计算中的FT参数及其描述。反应式容错技术描述参数/参数描述检查点(Ataallah等人,2015;Hosseini and Arani,2015)工作迁移(Prathiba和Sowvarnica,2017)复制(Amin等人,2015;Hosseini and Arani,2015)用于定期保存系统的状态。在组成任务失败的情况下,作业将从最后检查的指针状态重新启动,而不是从头开始它防止了有用计算如果一个作业由于某种原因不能在某个特定的物理机器上完成它的执行并且失败了,那么它将被迁移到其他机器上用于创建任务的多个副本并将副本存储在不同位置。任务可以在出现故障或失败的情况下继续执行,直到所有副本自适应根据条件自动执行所有流程性能用于确保系统响应时间响应/回复特定算法所花费的总时间计算成功完成的任务数可靠性其主要目的是在一定的时间内提供准确或可接受的结果可用性它被描述为概率,即系统在请求/预期使用可用性用户可以利用一项发明/产品以高效、有效和满意的方式完成目标被破坏S-Guard(Bala和Chana,2012)这取决于回滚和恢复开销关联确定执行容错(FT)算法(Prathiba和Sowvarnica,2017)任务重新提交(Amin等人,2015;Ataallah等人,(2015年)救援工作流程(Prathiba和Sowvarnica,2017)表2过程在这种方法中,任务会重复执行,直到成功。相同的资源用于重试不成功/失败的任务在该方法中,失败的任务被再次提交/重新提交到相同的资源和/或不同的机器以供执行它使系统能够在任务/作业失败后继续工作,直到在不修改故障的情况下成本效益这是一个系统货币描述2013; Nazari Cheraghlou等人,2016; Amin等人,2015; Saikia和Devi,2014; Essa,2016)。系统中可能发生各种类型的故障,如图1所示进行分类。 五、错误:由于存在故障,系统组件可能会进入错误状态或不正确的条件。一种系统,组件带有描述的主动容错。主动容错技术描述部分甚至完全失效(Amin等人,2015; Singh和Kinger,2013)。分布式系统可以包含各种类型自我愈合(Saikia和Devi,2014;Ataallah等人,2015; Park等人,(2005年)SoftwareRejuvenation(Amin等人,2015; Prathiba和Sowvarnica,2017)先发制人的迁移(Bala和Chana,2012年; Engelmann等人,(2009年,2009年)负载平衡(Nazari Cheraghlou等人,2016年; Rendezvous等人,2009;Singh和Kinger,2013)此方法使用分治技术,将大型任务分解为多个块。这种划分主要是为了提高系统当同一应用程序的多个实例在不同的VM(虚拟机)上运行时,应用程序实例的故障它允许计算设备或系统自己识别、识别和修复发生的困境/问题,而不依赖于管理员在这种方法中,系统经历周期性的重新引导,并且每次都从新的状态开始。在这种方法中,不断地观察和分析应用,因此,依赖于反馈回路控制方法。这种方法用于在内存和CPU的负载超过最大/特定限制时平衡内存和CPU的负载。超出的CPU负载被转移到其他未超过其最大限制错误,如图所示。 六、故障:它是指用户(人类或其他计算机系统)可能观察到的系统的错误行为。只有当系统的输出或输出不正确时才能识别故障( Amin 等 人 , 2015; Singh 和 Kinger , 2013;Prathiba 和Sowvarnica,2017)。 故障可按图1所示进行分类。7.第一次会议。容错方法是必要的,因为它们有助于检测和处理系统中可能由于硬件(H/W)故障或软件(S/W)故障而发生的故障。容错在云平台中尤其重要,因为它可以保证应用程序的性能,可靠性和可用性。为了实现云计算中的鲁棒性,需要有效地访问和处理故障(Gokhroo等人,2017年;Nazari Cheraghlou等人,2016; Amin等人,2015; Saikia和Devi,2014)。一些容错方法,确定从literature可以分类(图。 8)如下:反应式容错:这种方法主要用于在故障/故障实际发生后减少云系统中故障的影响。 它为系统提供了鲁棒性或可靠性(Saikia和Devi,2014; Charity和Hua,2016)。响应式容错方法已经被探索用于云以及其他分布式系统。表1列出了这些措施。例如, 2008年)。系统中的故障是由错误引起的,而这一切,都是因为失误(图)。 4). 这些措施如下:故障(Faults):系统无法执行其必要/需要的任务,这是由系统的一个或多个部分中存在的某些异常状态或错误引起的(Singh和Kinger,主动容错:这种方法用于主动预测故障,并用一些运行的组件替换可疑组件,即,它避免了从故障和错误中恢复(Charity和Hua , 2016; Valle 等 人 , 2008;Mukwevho 和 Celik , 2018;Engelmann等人,2009年,2009年)。表2概述了主动FT技术。●●●●●南纬1166号库马里山口 Kaur/Journal of King Saud University- Computer and Information Sciences 33(2021)1159- 1176云计算中用于容错的参数:使用各种参数来评估云计算中的容错方法,以检查云系统的效率和有效性(Prathiba和Sowvarnica,2017; Bala和Chana,2012)。表3中列出了可能的参数。3.1. 分布式计算环境容错(FaultTolerance,FT)是云计算平台中的基本关注点,因为它使得系统能够在系统组件存在一个或多个故障的情况下提供具有良好性能的所需服务(Gokhroo等人,2017; Valle等人,2008年;Mukwevho和Celik,2018年)。在过去,容错方法已经被应用于许多不同的分布式计算环境,除了云计算。其中一些如下:有线分布式系统:它是一个自治计算机的集合,对它的用户/用户来说,它是一个单一的一致系统。分布式系统中的所有计算机都包含一组单独的资源,并且可以共享一些通用的外围设备,例如:打印机消息传递通常用于分布式系统中的通信设计分布式系统是一项艰巨的任务,因为存在可能位于不同位置/站点的组件。系统设计人员必须面对的主要挑战之一是提供容错(FT)。一般来说,在分布式网络系统中,特别是在大规模的环境中,对FT的要求很高分布式系统的用户要求系统即使在技术故障的如果系统的一个或多个成员崩溃了,即使这样,系统也应该能够满足客户端因此,必须设计和实现一个有效的系统故障检测和进程监控是分布式系统中最常用的故障检测技术。诸如检查点、复制、重试、重新提交等的反应式容错方法已经被用于处理这些系统中的故障(Xiong等人,2009年;https://www.slideshare。net/sumitjain2013/fault-tolerance-in-distributed-systems)。移动计算系统:它是一种分布式系统,其中部分或所有组成节点都是移动计算机。该系统保持连续的网络连接,即使在主机的移动性的存在下,由于其在网络内的站点/位置可能随时间而变化系统中的每个节点独立工作,很少有异步消息通信。移动系统中的固定节点可以使用静态网络互连此外,固定节点(通常为移动基站)用于建立连接节点之间的通信,即,移动节点和系统内的其它节点。移动系统中的节点使用消息彼此通信(Park等人,2002年; Tantikul和Manivannan,2005年)。移动系统的一些限制是有限的带宽,移动主机有限的磁盘空间,用户的移动性,窄的电池寿命等,以克服移动计算系统的限制,一些容错方法被使用。在移动系统中最常用的FT方法是检查点,因为有限的资源阻止使用基于冗余的方案,如复制等。FT技术需要定期检查的进程将无错误状态移动如果出现任何故障,进程,则可以通过查找最新保存/维护的状态来恢复该故障(称为回滚恢复)。(Singh和Cabillic,2003年)。检查点机制可以分为协调检查点机制、通信诱导检查点机制和非协调检查点机制。在协调方法中,进程通过传递基于检查点的协调消息来调整它们的检查点操作。协调的检查点策略包括巨大的消息开销,因此不适合于移动系统,并且在网络中具有非常小的带宽无线通信此外,在检查点协调时,进程执行也可能需要被挂起,这可能导致性能的降低。不协调的检查点方法允许进程在没有与其他进程同步的情况下以规则的间隔接收检查点(Prakash等人,1996; Agbaria和Sanders,2004),但是这种方法可能遭受多米诺骨牌效应。通信诱导的检查点方法已被用于处理多米诺骨牌效应(Park等人, 2002年)。移动网格计算:网格是非常大规模的系统,在性质上是分布式的。这些将工作量分散到组成系统中。网格计算促进了大规模资源在松散协调的分布式系统之间的共享,以解决大型任务的计算需求。因此,网格计算为用户提供了巨大的计算、带宽资源和存储空间。也可以将网格计算与移动计算结合使用,以获得更好的性能。 这种方法对于有效地处理移动设备的基本限制也很重要(Buyya等人,2009; Altameem,2013)。然而,由于不可靠的连接、随机的节点移动性、电池依赖性、用于通信的小带宽、用于处理和固定存储的受限功率,将移动和网格设备合并以使用计算资源是具有挑战性的。移动网格计算(MoG)中的分布式应用程序的有效执行是可取的,如果移动设备的故障/故障得到妥善处理(Jaggi和Singh,2014)。因此,需要FT策略来处理MoG中的不同类型的故障MoG中最常用的FT技术是检查点和回卷恢复。这些FT方法已被广泛用于传统的有线和蜂窝便携式分布式系统。Jaggi和Singh(2014)提出了一种基于检查点的MoG自适应方法来恢复移动节点的故障。Darby和Tzeng(2010)提出了ReD(Reliability Driven)中间件方法,该方法使移动网格调度器能够构建明智的结论/决策,有选择地将工作部分提交给具有改进的检查点安排的主机,以保证成功完成。MANET(移动自组织网络(N/W)):-它是自配置的无线自组织网络,并且不依赖于基础设施,即,它是以无线方式连接的移动设备的无基础设施网络。MANET中的所有设备都是自治的,可以动态地改变它们的路径和方向,因此频繁地改变到其他设备的链路。移动自组网被广泛用于提高现有移动系统和移动网格计算(MoG)的计算能力。但是,MANN容易受到几个瞬时/临时和永久故障。为了处理失败,要求有效地使用FT技术。检查点以及回滚恢复是用于处理静态和/或蜂窝移动系统中的故障的广泛使用的策略。然而,在这方面,●●●●●P. 库马里山口 考尔/沙特国王大学学报-计算机与信息科学33(2021)1159-11761167表4基本网络拓扑摘要拓扑结构特点优点缺点● 总线拓扑● 环拓扑● 明星拓扑● 网状拓扑● 树拓扑● 混合拓扑● 它只在一个方向上传输数据● 所有的计算机设备都连接到一根电缆上● 该拓扑使用具有大量节点的中继器● 数据按位传输,即以顺序方式传输● 所有节点都连接到中心集线器● 集线器用作中继器,并在数据流中提供帮助● 与光纤、双绞线或同轴电缆配合使用● 完全连接● 鲁棒● 不灵活● 如果工作站/计算机节点成组● 主要用于WAN(广域网)● 它是两个或两个以上拓扑● 此拓扑结构具有成本效益● 与其他拓扑相比,需要更少的电缆● 适合小型网络● 更容易理解● 通过将两条电缆合并在一起,● 网络传输不会因为增加多个节点或高流量而受到影响● 扩展和安装成本非常低● 在计算机节点少、网络流量● 制造商升级集线器● 故障排除● 修改和设置● 每根连接电缆都可以传输自己的数据负载● 它非常健壮● 故障诊断简单易行● 提供隐私和安全● 总线拓扑和星型拓扑● 扩展节点● 更易于管理和维护● 检测错误● 非常可靠● 有效● 可扩展● 当电缆出现故障时,整个网络就会出现故障。● 在网络流量过大或增加更多节点的情况● 电缆长度有限● 比其他拓扑● 故障排除非常关键● 增加或删除计算机节点可能会扰乱网络● 如果一个计算机节点发生故障,则会扰乱整个网络● 安装成本高● 使用非常昂贵● 如果中央集线器发生故障,则整个网络停止工作● 性能取决于集线器● 难以安装和配置● 布线成本高● 它需要大量布线● 重缆● 昂贵● 如果添加多个节点,则维护非常困难● 如果中心集线器出现故障,整个网络就会出现故障● 设计复杂● 昂贵●灵活FT方法与MANSYS的使用较少被检查。由于静态基础设施的不足、节点的定期移动、有限的带宽以及有限的稳定存储量等挑战,前述基于恢复的方法不直接为了处理移动自组网中的故障,已经提出了基于检查点的回滚恢复协议,该协议根据移动性/便携性来确定移动终端/节点的检查点的频率,从而避免不必要的检查点(Jaggi和Singh,2015; Chandra和Reddy,2016)。4. 云计算中的容错方法4.1. 系统模型云计算通过互联网提供各种服务和可扩展的计算资源(NazariCheraghlou等人,2016年)。在提供商方面,DC(数据中心)提供设施以保持计算机系统以及它们的相关联的组件,如联网、存储、不间断电源等(Liu等人,2014; Wang等人,2014年、2015年)。为了向客户提供服务,许多虚拟机(VM)在云DC中的物理机器上运行。这些DC使用不同类型的网络拓扑。云计算系统中的容错方法取决于底层网络拓扑。在本节中,我们将讨论云系统DC中的基本通用网络拓扑,以及云中使用的反应式和主动式FT方法网络拓扑是网络中节点的排列(Pandya,2013)。换句话说,拓扑是将计算机系统相互连接的网络的基本构建块(Bisht和Singh,2015)。基本的网络拓扑是总线,环形、星形、网状、树形和混合拓扑结构(https://www.ight.com/computer-networks/network-topology-types)(参见表4)。总线拓扑:此拓扑用于通过一根电缆连接所有计算机和网络设备。它只向一个方向传输数据。这种拓扑结构非常具有成本效益,用于小型网络,更容易理解和扩展。然而,在这种拓扑中,当 电 缆 出 现 故 障 时 , 整 个 网 络 都 会 出 现 故 障 ( Santra 和Acharjya,2013)。如果网络(n/w)很重,则此拓扑的性能会降低。电缆长度有限与环形拓扑相比,这种拓扑较慢(Bisht和Singh , 2015; https : //www.studytonight.com/computer-networks/network-topology-types)。环形拓扑:在这种拓扑中,计算机系统以环形结构彼此连接,其中最后一个设备连接到第一个设备(Hegde等人, 2013年)的报告。这种拓扑结构的安装和扩展都非常便宜在网络业务量大和增加一些额外节点的情况下,传输网络不受影响。然而,一个计算机系统的故障可能会影响整个网络。添加或删除计算机会干扰网络活动。在环形拓扑中,故障 排 除 也 非 常 困 难 ( Bisht 和 Singh, 2015;https://www.studytonight.com/computer-networks/network-topology-types)。星型拓扑:-此拓扑用于连接所有计算机通过电缆将系统连接到单个集线器此集线器用作中心节点,所有其他可用节点都链接到它。此拓扑提供快速性能,更易于故障排除、设置和修改。然而,这种拓扑使用起来很昂贵,如果集线器出现故障,整个网络就会停止●●●南纬1168号库马里山口 Kaur/Journal of King Saud University- Computer and Information Sciences 33(2021)1159- 1176作 用 了 安 装 成 本 很 高 ( Pandya , 2013; Bisht 和 Singh , 2015;Hegde等人, 2013年)的报告。网状拓扑结构:-在这种拓扑结构中,所有的节点或计算机系统,tems是完全相互链接。这种拓扑结构非常健壮,更容易诊断故障。它还提供隐私和安全。但是,这种拓扑结构很难安装或配置。布线成本也很高,需要大量布线(Pandya,2013; Bisht和Singh,2015;Santra和Acharjya,2013)。树拓扑:此拓扑包含一个根节点,所有其他计算机或节点都链接到它(称为分层拓扑)。层次结构的最小级别应该是三。该拓扑是总线和星型拓扑的扩展版本它也更容易管理和维护。在这种拓扑结构中,错误检测也很容易完成。然而,这种拓扑结构包括昂贵的过程,并且需要大量布线(Pandya,2013; https://www.studytonight.com/computer-networks/network-topology-types; Santra and Acharjya,2013)。混合拓扑:这种拓扑是两种或两种以上拓扑的组合。这种拓扑提供了可靠性、可伸缩性和灵活性等特性。然而,它的设计是复杂的 , 并 且 涉 及 昂 贵 的 过 程 ( https : //www.udytonight.com/computer-networks/network-topology-types;Santra和Acharjya,2013)。在云计算环境的数据中心中最常用的网络拓扑如下:胖树拓扑:-该拓扑是用于云数据中心(DC)的高性能计算(HPC)和集群的最广泛使用的拓扑。它是一种双向多级间接拓扑结构,提供了容错能力和良好的性能水平。然而,胖树拓扑所使 用 的 硬 件 是 非 常 昂 贵 的 ( Liu 等 人 , 2014; Wang 等 人 ,2014;Gómez等人,2006; Coll等人,2009; Sem-Jacobsen等人,2011年)。RUFT(简化的单向胖树):-RUFT拓扑是单向MIN(多级互连网络),它提供了类似于胖树的良好性能,但硬件成本非常低。这种拓扑结构尚未被任何容错(FT )方法使用(Bermúdez Garzón等人,2016; Garzón等人,2014; Gómez等人, 2008年)。RUFT-PL(reduced unidirectional fat tree with parallel link):它基于创建企业和注入链接的副本。它还以均衡的模式分配网络的流量,以减少双链路之间的HoL(Head of the Line)阻塞影响。RUFT-PL使用的交换机数量与RUFT和胖树拓扑中的交换机数量相似。RUFT-PL的交换机还可以是RUFT交换机的单向端口的数量的两倍(Bermúdez Garzón等人,2016; Garzón等人, 2014年)。FT-RUFT-212(Fault Tolerance RUFT 212):-此拓扑通过创建连接到或来自结束节点的链路的副本来促进容错(FT)功能即以计划的方式连接节点,这可能需要硬件(H/W)价格的少量增加 它使用与RUFT拓扑中类似的链路数量以及交换机之间类似的连接蓝图(Bermúdez Garzón等人,2016; Garzón等人, 2014年)。FT-RUFT-222(Fault Tolerance RUFT 222):-它结合了RUFT-PL的性能特征以及FT-RUFT-212 的容错( FT )特征。它包含RUFT拓扑的FT变体它利用两个链路来创建网络和处理节点之间的连接,两(2)个链路用于互连开关,以及两(2)个链路来创建最后的相位开关和处理节点之间的连接(Bermúdez Garzón等人,2016; Garzón等人, 2014年)。Z-Fat Tree拓扑:它是胖树的扩展,称为Z-Fat Tree(Zoned-FatTree)。该扩展主要涉及通过提供某种额外程度的连接来利用每个交换机的额外端口Z-fat树的主要目的是处理可扩展性,FT以及路由问题它处理与以最小复杂度创建最优FT(胖树)拓扑相关的优化问题(Adda和Peratikou,2017)。Clos网络拓扑:-它是一种多级网络。它提供了一个非阻塞网络,多级交换架构,减少了建立连接所需的端口数量该网络拓扑包含三个阶段:入口阶段、中间阶段和出口阶段。这些阶段中的每一个都使用多个纵横制交换机进行预交换(Liu等人,2014;Wang等人,2014; Dong和Rojas-Cessa,2011)。VL 2拓扑:-这是一种灵活且极具成本效益的网络(n/w)设计。它是使用各种交换机创建的,组织在Clos网络拓扑中。此拓扑采用Valiant负载平衡(VLB)在网络路径之间分配流量。 它还利用地址解析来帮助实现巨大的服务器池(Liu等人,2014; Wang等人,2014; Greenberg等人,2009; Zhang等人, 2018年)。DCell拓扑:-这种拓扑通过几个端口使用服务器,也可以使用低端小型交
下载后可阅读完整内容,剩余1页未读,立即下载
![doc](https://img-home.csdnimg.cn/images/20210720083327.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![-](https://csdnimg.cn/download_wenku/file_type_lunwen.png)
![-](https://csdnimg.cn/download_wenku/file_type_lunwen.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://profile-avatar.csdnimg.cn/default.jpg!1)
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![](https://csdnimg.cn/release/wenkucmsfe/public/img/voice.245cc511.png)
会员权益专享
最新资源
- 利用迪杰斯特拉算法的全国交通咨询系统设计与实现
- 全国交通咨询系统C++实现源码解析
- DFT与FFT应用:信号频谱分析实验
- MATLAB图论算法实现:最小费用最大流
- MATLAB常用命令完全指南
- 共创智慧灯杆数据运营公司——抢占5G市场
- 中山农情统计分析系统项目实施与管理策略
- XX省中小学智慧校园建设实施方案
- 中山农情统计分析系统项目实施方案
- MATLAB函数详解:从Text到Size的实用指南
- 考虑速度与加速度限制的工业机器人轨迹规划与实时补偿算法
- Matlab进行统计回归分析:从单因素到双因素方差分析
- 智慧灯杆数据运营公司策划书:抢占5G市场,打造智慧城市新载体
- Photoshop基础与色彩知识:信息时代的PS认证考试全攻略
- Photoshop技能测试:核心概念与操作
- Photoshop试题与答案详解
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035111.png)
安全验证
文档复制为VIP权益,开通VIP直接复制
![](https://csdnimg.cn/release/wenkucmsfe/public/img/green-success.6a4acb44.png)