没有合适的资源?快使用搜索试试~ 我知道了~
理论计算机科学电子笔记261(2010)5-21www.elsevier.com/locate/entcs依赖服务Katinka Wolter1,2Philipp Reinecke1,3计算机科学研究所9柏林自由大学14195Berlin,Germany摘要在本文中,我们研究使用随机模型分析面向服务的系统。我们提出了一个迭代的混合方法,使用系统测量,试验台观测以及正式模型导出一个定量模型的服务为基础的系统,使我们能够评估有效性的重启方法在这样的系统。在某些情况下,如果一个人足够幸运,能够访问一个真实的系统进行测量,所获得的数据往往缺乏统计意义或系统的知识, 不足以解释数据。然后,测试台可能是首选,因为它允许长时间的实验系列,并提供系统配置的完全控制。为了提供有意义的数据,试验台必须配备故障注入使用合适的故障模型和适当的负载模型。我们将相位类型分布拟合到从测试台获得的数据中,以便在模型中表示观察到的数据,该模型可以用作例如我们面向服务的系统的嵌入模型中的服务过程。该模型可用于分析不同的重新启动政策、业务规模或服务规则。该模型的结果可以输入到试验台中,并为其提供更好的故障和负载模型,从而闭合建模回路。关键词:故障模型,性能模型,可靠性,自适应性1引言基于服务的系统在今天被广泛使用。面向服务的系统的性能和可靠性取决于不同的因素,如单个服务的性能和可靠性以及连接它们的基础设施由于面向服务系统的组件通常分布在不同的位置,因此通常只能通过它们在网络中的行为来观察它们。用户既不能确定服务本身的状态,也不能确定执行服务的系统的状态。专有应用程序增加了访问和观察服务及其性能和可靠性的困难。由于无法在内部监视和度量面向服务的系统,1 这项工作得到了德国研究委员会(DFG)的支持,基金编号为WO 898/2-1和WO 898/3-1。2电子邮件:katinka. fu-berlin.de3电子邮件:philipp. fu-berlin.de1571-0661 © 2010 Elsevier B.V. 在CC BY-NC-ND许可下开放访问。doi:10.1016/j.entcs.2010.01.0036K. Wolter,P.Reinecke/Electronic Notes in Theoretical Computer Science 261(2010)5对于数学模型,至少可以评估模型中不同容错机制的不同系统配置。定量模型建立了无法直接观察的系统抽象。只有在对系统及其经营环境有一定了解或可作出有根据的假设的我们提出了一种方法,包括实验以及模型,以便得到一个坚实的随机模型,我们将说明在重新启动方法的评估。我们使用一个面向服务系统的测试床作为我们的多级故障注入框架(MLFIT [12])的实现来获取系统数据。将模型拟合到我们的测量数据允许我们在正式模型中使用实验数据的分析表示。但是,为了从试验台获得真实的观测结果,必须包括适当的负载、故障和干扰模型到目前为止,我们使用非常简单的模型,仍然需要改进。 我们证明了一个良好的故障模型的重要性,从Sandesha,Web服务可靠的消息传递(WSRM)的实现我们的方法适用于任意模型。我们证明了它使用的重新启动模型和一个简单的重新启动方法的模型。类似地,可以用公式表示随机Petri网[8]或PEPA模型[4]。模型的必要参数可以从我们的测试平台中获得,这反过来又需要一些随机模型来产生现实的结果。总之,迭代建模方法是必要的,以执行一些有意义的正式建模和面向服务的系统的分析在本文中,我们说明了迭代方法适用于重新启动方法。该重启方法提高了面向服务系统的性能和可靠性restart方法重传在给定时间内未被确认的消息该方法可应用于内部状态既不能被用户监视也不能被用户控制的系统。用户或客户端的引擎可以尝试通过重新发出服务请求来提高服务为了研究重新启动方法,我们应用我们的迭代方法:在下一节中,我们首先推导出正式的重新启动模型,并从其分析中提出一些重要的性质和结果。然后,我们根据第3节中测试平台的实际测量结果对模型进行了改进。在第4节中,我们讨论了现实世界系统和测试平台中测量的优点和缺点第六节是本文的结论。2重新启动方法重启方法直接涉及一个非常简单的抽象模型[19]:让随机变量T表示任务完成时间或服务响应时间。假设任务根据具有密度函数f(t)和分布函数F(t)的某个概率分布完成那么,引导我们分析的问题是:K. Wolter,P.Reinecke/Electronic Notes in Theoretical Computer Science 261(2010)57为了最小化完成时间的各个时刻,最佳时间τ是多少?重新开始?使用我们简单的抽象模型,我们可以通过研究以下不等式来回答这个问题:E [T] τ]⑴不同的完成时间分布。例如,在一个示例中,对数正态分布的任务完成时间的分布和重启下的分布在图1中示出,其中每次重启的时间惩罚(成本)为0。1时间单位。f(t)fT(t)6543210.1 0.2 0.30.4654321t0.50.1 0.2 0.30.4t0.5图1. 不重启和重启的分发从(1)[18,19,20]中可以得出一些优雅而有趣的结果:重启不一定在连续尝试之间的“固定”时间发生只有当一个人想要最小化完成时间E [T]的第一时刻时,最好的策略是以固定的间隔重试。我们选择τ,E[T] =M(τ)+(1−F(τ))·τ F(τ)(二)哪里∫τM(τ)=0tf(t)dt表示部分第一时刻。更简单地说,我们发现重试应该发生在风险率与最终完成时间的倒数倒数的时间点τn1−F(τ)f(τ)=E [Tτ]风险率h(t)=f(t)1−F(t)从可靠性分析中已知系统部件的故障率。在我们的模型中,风险率描述了完成的可能性在危险率增加的情况下如果风险率降低,那么随着时间的推移,任务完成的可8K. Wolter,P.Reinecke/Electronic Notes in Theoretical Computer Science 261(2010)5能性也会降低,并且应该立即重新开始。在实践中,人们很少遇到严格的K. Wolter,P.Reinecke/Electronic Notes in Theoretical Computer Science 261(2010)59h(t)1086420.1 0.2 0.30.4t0.5图2. 曲面等于矩形规则单调风险率-既不减少也不增加。大多数情况下,风险率首先增加,然后减少。在这些情况下,我们的近似值应该适用。它允许我们制定如图2所示的工程规则。最佳的重新启动时间可以在密度的积分等于由密度函数上的特定点确定的矩形的对于完成时间较高的时刻,最好在开始时以较快的速度启动重启,然后放慢速度。对于完成时间的分布,也有有趣的结果。例如,为了最大限度地提高截止日期的概率,应该在风险率相等的时间点重新启动。遵守此准则的特殊情况是在等距时间点重新开始,但这并不总是全局最优(实际上它可能对应于局部或全局次优)。更具体地说,有两个性质特别相关:更高的矩可以从重新开始中受益更多,如果重新开始是有益的,那么更多的重新开始进一步减少了完成时间的矩,即E[Tτ]E[T]惠E[Tτ]E[T<<τK+1]= 1,如图3所示。E[TTk]/E[Tk],k=1,2,32.521.510.5平均完工时间0.2750.250.2250.20.1750.150.125重启Τ0.25 0.5 0.75 1 1.25 1.5 1.75 20.05 0.1 0.15 0.2次图3. 重新启动时力矩的减小基于这些发现,可以设计出计算最佳重启超时的算法由于在实际情况中,我们通常不知道完成时间分布的解析密度函数,因此算法[21]基于观察到的完成时间的直方图。重新启动方法引起不同的建模问题。首先,它本身构成了一个通过概率分布定义的模型。如果概率E[TT]/E[T]E[TT2]/E[T2]E[TT3]/E[T3]无限重启动不重新启动1次重启5次重启10K. Wolter,P.Reinecke/Electronic Notes in Theoretical Computer Science 261(2010)5任务完成时间的分布是已知的,重新启动下的分布以及对于不同的感兴趣的度量的最佳重新启动时间可以被计算,如我们将展示的。第二,重新启动方法适合于数学建模。可以使用不同的形式来对重启方法进行建模我们选择一个简单的模型,但其他模型,如Petri网或PEPA模型[4]也可以公式化3系统评价虽然在重新开始方法的分析中肯定是有用的,但前一节中提出的简单抽象模型有许多缺点:首先,它假设简单随机变量是完成时间的精确模型。其次,分析是在分析密度函数已知的分布上进行的,而通常情况并非如此。当应用纯粹基于模型的方法时,这样的问题是常见的正如我们将在本节中说明的那样,它们可以通过研究真实系统来解决。 让我们从现实世界的完成时间是否存在足够的可变性开始,以及完成时间是否可以简单地通过其分布来建模,而不考虑后续尝试之间可能的相关性。在[10,11]中,我们研究了随机选择的网站的HTTP GET调用的完成时间。虽然这项研究并不是专门针对面向服务的系统,但基于传输控制协议(TCP)的HTTP的特性是一个很好的起点,因为当前的SOA(面向服务的架构)系统基于SOAP(简单对象访问协议)通信,该通信通常封装在HTTP请求中。90807060504030201000300006000090000120000 150000 180000 210000 230000意见图4. 观察连接建立时间图4[10]显示了在超过56000个随机数据上观察到的连接建立时间连接建立时间K. Wolter,P.Reinecke/Electronic Notes in Theoretical Computer Science 261(2010)511选择URL我们观察到,虽然大多数连接设置完成得相当快,但有几个样本层的速度是3秒的倍数。 这些可以归因于TCP重传超时(RTO),用于在连接建立阶段检测数据包丢失[7]。在面向服务的系统中,这种延迟会导致消息传输时间的急剧增加。重新启动可能有助于避免这些延迟。10000800060004000200000200040006000CST 1(ms)800010000图5. CST 1与CST 2为了研究尝试之间的相关性,我们进行了另一系列实验,其中我们连续两次下载相同的对象。图5显示了第一次和第二次连接建立时间的散点图。如果连接建立时间是高度相关的,我们应该观察到一个直对角线。对于TCP RTO超时的值(3s、6s等),存在不同的0-对角簇意味着极端延迟通常不相关。特别地,CST1轴上的簇指示第一次尝试的大连接建立时间之后可能是重试的非常小的连接建立时间。3.1面向服务系统面向服务系统的实验评估尤其困难。这些系统通常分布在不同的物理位置,非常复杂。因此,各种不期望的和未指定的因素使测量变得模糊。通常,系统组件的内部状态和通信路径都不知道到能够完整解释观测数据的程度。为了解决这些问题,在[12]中,我们提出了多级故障注入测试床(MLFIT)框架。该框架旨在为面向服务的系统提供一个测试平台,其中故障可以在各个级别注入,基于真实的故障和干扰模型这允许控制实验,CST 2(ms)12K. Wolter,P.Reinecke/Electronic Notes in Theoretical Computer Science 261(2010)5一个面向服务的系统,同时保持实验的复杂性可管理。图6. SOA测试平台目前,MLFIT是使用SUN的SOA参考应用程序Java Adventure Builder实现的我们感兴趣的定量属性,如依赖性,性能和适应性。这些属性将从用户用户访问一个复杂的分布式系统,但只能通过其Web界面和那里看到的响应时间来观察系统行为。我们想应用重启方法,因此只对定时行为感兴趣。我们向Adventure Builder系统发出请求并监视响应时间,以确定重启模型的经验分布函数用户不会看到任何系统细节,并且对于设置重启模型,我们也不想深入系统由于试验台不是真实的,分布式系统,这类系统的一些特性必须进行仿真。Adventure Builder包含一个网站,作为用户的入口点。 这个网站连接到一个订单处理中心服务,它并行地向银行和航空公司、住宿服务和活动服务发送请求。订单处理中心收集其他服务我们仅限于时间干扰,因为这些是我们模型的兴趣。为了模拟服务之间以及服务与用户之间的大型网络的效果,我们在图6中FI所示的选定点处使用故障注入。请求由负载发生器产生,测量结果存储在数据库中。该测试平台使用两个随机模型,一个用于负载生成,一个用于故障注入。这两个模型目前都相当简单:故障注入应用3%的IP数据包丢失,负载模型分别由10、25和50个用户组成,每个用户执行100个预订。图7显示了一个场景的响应时间的直方图,该场景有10个用户和航空公司的样本,有故障注入和没有故障注入。请注意图中的不同比例。该数据使用相型分布[9]进行近似,并用于第5节中的参数化模型。连续相位型分布(PH)是连续时间马尔可夫链中的吸收时间[9]。 它通常表示为初始概率向量α和子生成矩阵Q的元组(α,Q)。图8显示了两个典型的相位类型模型,我们都使用它们来应用。订单状态请求数据库现状答复时间戳Fi活动住宿OPC网站航空公司Fi银行负载生成器K. Wolter,P.Reinecke/Electronic Notes in Theoretical Computer Science 261(2010)5130200400600800010002000300040005000 6000响应时间响应时间图7.航空公司10个用户的数据采样直方图,无故障注入(左)和有故障注入(右) 卢恩卢恩a)b)、图8. 非循环相型分布模型(ACPH(2))(a)和Hyper-Erlang分布(b)近似我们的数据。图8a)示出了2阶(ACPH(2))的一般非循环相型分布。图8b)显示了一个Hyper-Erlang模型,其中有n个长度可能不同的Erlang分支为了使用相型分布拟合我们的数据,我们必须确定分布的顺序和拟合方法。如下一节所述,先前对WSRM场景[13]中将相位类型分布拟合到传输时间的评估表明,使用矩匹配[17]获得的ACPH(2)(如图8所示)足以捕获相关特性。我们更喜欢这个模型,因为它可以方便地用于我们的生产模型。拟合的ACPH(2)模型的参数列于表1。α1λ1λ2E[T]c2nla100.981990.0355680.03555755.73 0.51l1a100.033170.0006600.013733123.075 10.24表1ACPH(2)参数(α2= 1 −α1)。第一个数据集(nla 10)由来自无故障试验台的观察结果组成卢恩卢恩频率050100200150频率010020040030014K. Wolter,P.Reinecke/Electronic Notes in Theoretical Computer Science 261(2010)5注射在这种情况下,测试台的响应时间几乎没有变化,因为测试台托管在同一实验室中通过专用网络连接的几台机器上。这可以从变化的低平方系数c2 = 0中看出。51. 在3% IP数据包丢失(数据集l1a10)的情况下,预期响应时间要长得多,响应时间的持续时间变化也大得多,这可以从第二个拟合模型的方差平方系数中在第5节中,我们使用两个拟合模型作为包含重启的队列中的服务时间分布。 人们可以将相位类型模型用于其他目的, 在测试床中模拟服务4在WSRM为了更深入的研究,我们在Web服务可靠消息传递(WSRM)中实现了重启算法我们使用Sandesha WSRM实现[1]。一个更先进的故障注入是用来模仿一个不可靠的网络的影响。故障是根据图9所示的两状态Gilbert-Elliot模型生成的。该模型通常用于研究网络模型中的数据包丢失[3,2]。我们考虑了三种不同的损失水平,• S1= 0。05s有损,120s无损• S2= 1s有损,30s无损• S3= 1s有损,8s无损其中持续时间表示指数分布长度的平均时间图9. Gilbert-Elliot损失模型在重启实验中,我们使用了三种不同的预言机来确定重启间隔:• 固定间隔(4s)• 雅各布森/卡恩• QEST算法固定间隔使用长度为4秒的静态间隔。Jacobson/Karn oracle使用TCP实现中常见的算法[6],而QEST算法使用基于我们的重启模型的超时计算。我们比较这些算法的基础上不同的指标。首先,我们使用前面提到的与公平性度量相结合的时刻度量。第一个瞬间K. Wolter,P.Reinecke/Electronic Notes in Theoretical Computer Science 261(2010)515固定区间Jacobson/Karn QEST算法S 1S2S3S4S5时间(来源)失R4r2r3r5ETT时间(目的地)图10. 度量的定义传输时间(ETT)是通过发送数据包的第一个副本与目的地首次收到数据包之间的时间来估计的,如图10所示。公平性度量URC(不必要的资源消耗)对回顾时不必要的传输的数量进行计数,因为不需要它们来保证分组的传输。我们用不同的相型分布来近似这些数据。我们考虑了三种非循环相型分布(ACPH):使用矩匹配计算的两态ACPH(2)[17],具有15个Erlang分支的Hyper-Erlang(HERD)分布(cf.图8)使用G-FIT工具[16]拟合,以及使用PhFit工具[5]与数据匹配的30阶完整非循环相位类型分布。注意,出于分析目的,低阶PH分布是优选的。另一方面,高阶分布能够更准确地捕获数据的特征。1 10.10.10.010.010.0010.0010.00011e-051 10 100 1000 10000100000ETT(ms)0.00010.1 10 100 100010000ETT(ms)图11.故障模型S3的CCDF(左)和拟合的相位类型分布(右)我们使用故障模型3和故障模型1和3的几个拟合分布绘制了以下两个曲线轨迹我们发现,数据严重干扰故障模型。因此,通过不同的分布获得最佳拟合跟踪图显示了TCP重传超时值(3s,6s,9s,...)的步长。在[13]中,我们使用拟合模型作为服务时间在M/G/1队列中分配。4.1另一个指标:适应性到目前为止,我们已经验证了重启算法和不同的预言机使用的预期传输时间和公平性度量URC。一个动态指标,ACPH(2)近似HErD近似ACPH(30)近似样本分布CCDFCCDF16K. Wolter,P.Reinecke/Electronic Notes in Theoretical Computer Science 261(2010)5210.10.010.0011e-041e-050.1 10 100 1000ETT(ms)图12. 故障模型S1的CCDF和拟合的相型分布评价重启方法的有效性是系统自适应性。 我们的适应性度量是基于一个payo的payo的度量pi表示有用的一系列试验i = 1,.、N. 每次试验都有一个与pi−1和pi相关的收益。一个积极的决定增加了收益Δi =pi+pi−1,而一个中立的决定保留了先前的收益,Δ i= pi,而否定的决策收益为零,即Δ i= 0。最大累积收益受决策次数N-1的限制。系统适应性表示为与最佳效益的距离,即适应性=中国I=2Δ i/(N− 1)。该自适应性度量取0和1之间的值,其中完美自适应系统具有自适应性1。系统或算法的自适应性通过支付度量来定义。支付能力指标可以基于ETT和URC,1P=,1+αET T+(1−α)URC其中,0≤α≤ 1表示及时性与公平。我们可以通过储蓄指标SAV来更详细地定义支付宝,SAV的定义如下。通过重新启动而不是等待第一次传输完成而节省的时间量提供了第三个性能指标我们在这里考虑。该时间被测量为第一次传输所需的时间ri1−si1与有效完成时间之间的差(ETT),即传输消息实际所需的时间,可能包括重新启动:SAVi=(ri1− si1)− ETTi。注意,第一次传输尝试失败导致SAV =∞。在基于储蓄的支付函数P2的定义中,采用了如果完成时间(SAVi)减少,则认为重新启动是有用的。S1FI ACPH(2)HERD ACPHCCDFK. Wolter,P.Reinecke/Electronic Notes in Theoretical Computer Science 261(2010)5170.10.010.0011e-041e-051e-061e-070ms 100ms 500ms 1000ms 2000ms节省阈值SAV*图13. 适应性大于阈值SAV_s(例如,SAV_s可以是100 ms):.2Sav (mi)=1:SAVi> SAV0:else.(三)这个payo函数也有界于[0,1],并且在1处具有最优值。图13显示了不同重启预言机的自适应性,这些自适应性是根据节省度量来衡量的。请注意,即使在高SAV阈值下,QEST oracle也能成功减少完成时间。5定量模型我们可以通过最小化(2)来计算我们两个模型的最佳重启超时。图14显示了在重启间隔τ内重启的预期响应时间。最小化(2)得到τ1 = 83。95,τ2 = 58。nla10和l1a10型号分别为72个。根据分析模型的预测,这些超时应导致平均响应时间E [T1]= 52。89和E [T2] = 64。56.有趣的是,较低的响应时间是使用较大的重启间隔实现的。Τ50 100 150 200图14. 对于nla 10和l1a10型号,E[T]处于重启状态。固定间隔(S1)Jacobson/Karn(S1)QEST算法(S1)固定间隔(S2)Jacobson/KarnE[ T]10080604020nla10l1a10AD2P18K. Wolter,P.Reinecke/Electronic Notes in Theoretical Computer Science 261(2010)5然而,应该注意的是,分析模型可能过于简单,因为它没有考虑重启对同一服务器的其他用户的影响。也就是说,重新启动作业以减少响应时间可能会导致负载增加,进而可能会增加响应时间。为了研究分布式环境下的重启方法,我们建立了一个简单的多输入流、单服务器的重启模型,并给出了一个实现不同重启策略的重启算法。该模型如图15所示。图15.单服务器队列到模型重新启动该模型的参数与上述服务时间分布中获得的SOA测试床。使用模拟,我们评估性能的固定间隔,Jacobson/Karn和QEST重启策略。对模型的分析表明,重新启动有助于减少完成时间并避免过载。Σ作业到达队列的速率为λ=iλi。 每个职位都会随机抽取一个致敬服务时间在排队等待时,作业的超时值将减少。超时可能在作业进入服务之前过期然后,作业使用新绘制的随机服务时间保持在队列中的位置。已等待的时间将添加到作业的响应时间中。如果新的服务时间再次导致超过超时的响应时间,则重复进行绘制短服务时间的新尝试。该模型中的作业响应时间由服务时间和等待时间组成,等待时间由队列中排在所考虑的在没有重新启动的情况下,该模型表示一个M/G/1排队,并给出了分析解。没有重启的模拟结果与表2中的解析解之间的比较表明,模拟很好地捕捉了热交换系统的行为请注意,队列中的响应时间不能与不包括任何等待时间的分析重启模型的响应时间进行比较。该模型允许我们计算的队列长度和响应时间的拥塞措施。模拟给定的任务时间,我们可以进一步研究完成的工作数量。该模型不允许指定具有个别排队和超时的客户。我们使用第3.1节和[14]中的两个ACPH(2)模型来指定我们的服务时间分布。我们设置载荷ρ = 0。95、选择K. Wolter,P.Reinecke/Electronic Notes in Theoretical Computer Science 261(2010)519不重启固定间隔QEST雅各布森-卡恩响应时间到达率λ。分析了不同重启策略对系统平均响应时间的影响。模拟结果列于表2中。我们观察到重启减少了nla10 l1a10M-G-1排队的分析结果854.713262.1模型没有一八二六82 ±7。57一三五零七。7±226。5Fi七四六70±6。65527号8 ±11。7JK444. 52± 4。53一百六十五5±3。1QEST四百一十35±7。20192. 5 ±12。02表295%置信区间两种情况下的完成时间。这种改善是特别引人注目的高方差服务时间分布(l1a10 ) , 平 均 响 应 时 间 从 超 过 13500 个 时 间 单 位 减 少 到 165.5 个 时 间 单 位 的Jacobson/Karn策略。对于低方差的服务时间分布(nla10),这种效应就不那么明显了。我们还观察到,对于这两种分布,自适应Jacobson/Karn和QEST策略的性能要比静态固定间隔策略好得多。50 500045 450040 400035 350030 300025 250020 200015 150010 10005 50000 100000 200000 300000 400000 500000时间00 5000 10000 15000 20000 25000 30000 35000工作图16.nla 10服务时间分布的队列长度和响应时间图16和图17显示了两种服务时间分布的队列长度和单个作业的响应时间的演变。如果没有重启,l1a10服务时间分布的队列长度和服务时间会变得非常大,而重启可以避免这种极端情况,而不管超时计算算法如何。表3显示,在两个模拟中,所有策略完成的工作数量大致相同。不同策略之间的差异可以通过查看图18中超时的发展来解释。对于nla10场景,我们观察到QEST超时首先上升,然后在实验的其余部分保持不变。相比之下,Jacobson/Karn超时会波动,通常会降至100以下,这说明Jacobson/Karn更有可能不重新启动固定间隔QEST雅各布森-卡恩队列长度20K. Wolter,P.Reinecke/Electronic Notes in Theoretical Computer Science 261(2010)5不重启固定间隔QEST雅各布森-卡恩雅各布森/卡恩算法QEST算法450 6000040035050000300 4000025020030000150 20000100501000000 500000 1e+06 1.5e+062e+06时间00 200040006000800010000120001400016000工作图17.l1a10服务时间分布的队列长度和响应时间nla10 l1a10无34049(-)15394(-)FI 33891(3)13157(98)沪ICP备16024562号-1QEST 33010(57)(8695(15))12642(533)表3已完成的作业数和重新启动的次数(在括号中)。重新启动QEST。对于l1 a10服务时间分布,我们再次看到Ja- cobson/Karn的超时比QEST算法的超时波动更大。这里,QEST超时大约是400,而Jacobson/Karn400 160035014001200300100025080020060015040010020050100002000030000400005000060000700008000090000100000模拟时间0100002000030000400005000060000700008000090000100000模拟时间图18. nla10(左)和l1a10(右)随时间的变化我们从仿真研究中得出结论,即使在高负载的系统中,重新启动方法也可以提高响应时间。另一方面,竞争场景的复杂性导致超时值和平均响应时间明显大于简单分析模型的预测值。我们可以看到,超时值在数据包丢失的情况下进行了调整,在这种情况下,预期响应时间会更长。这样可以避免不必要的网络堵塞,不重新启动固定间隔QEST雅各布森-卡恩雅各布森/卡恩算法QEST算法队列长度重新启动超时时间响应时间重新启动超时时间K. Wolter,P.Reinecke/Electronic Notes in Theoretical Computer Science 261(2010)521工作和增加拥堵。超时值的自适应计算确保重启频率根据网络和系统条件进行调整6结论在本文中,我们提出了一个迭代的和混合的建模和实验方法来评估面向服务的系统。我们已经看到,复杂分布式系统的随机模型的公式化需要只能通过进行实验获得的信息,即使模型相当简单。使用真实系统的实验经常会导致无法解释的结果,并且非常耗时。一个试验台可能是一个合适的妥协,使我们能够完全控制系统,同时仍然是现实的动态。因此,我们使用一个测试平台,以获得一个现实的响应时间分布。我们已经近似观察到的响应时间使用相位型分布。这给了我们一个小的马尔可夫模型,它捕获了经验数据集的信息,并可以包含在一个更大的模型中。我们首先使用相型分布作为重新启动模型的概率分布,其次,作为服务时间分布在一个重新启动模型。重新启动模型的解析公式为我们提供了快速的结果,而对于重新启动的模型,我们不得不求助于模拟。我们将在未来增强我们的试验台更精细的故障和负载模型,并将研究其定时行为和使用小相型分布的代表引用[1] Apache软件基金会。 阿帕奇·桑德沙 http://ws.apache.org/sandesha/网站。[2] OliveerrH ohlf el d,Ru?digerGeib,anddGerhardH alinger. 实时服务中的故障:生成QoE损伤的马尔可夫模型。在Proc. of the 16 th International Workshop on Quality of Service(IWQoS),第239-248页[3] 格哈德·哈斯林格和奥利弗·霍菲尔德 因特网实时业务中的数据包丢失的gilbert-elliott模型。在MMB,第269-286页[4] J·希尔斯顿 一种性能建模的合成方法。 剑桥大学出版社,1996年。[5] 而且我的丈夫也没有和我一起工作。PhFit:一种基因重组Phase-TypeFittingTool.InTOOLS' 02:Proceedings of the12th International Conference onComputer Performance Evaluation ,Modeling Techniques and Tools,pages 82-91,London,UK,2002. 史普林格出版社[6] 范·雅各布森拥塞避免和控制。ACM Computer Communication Review; Proceedings of the Sigmund[7] 巴拉钱德·克里希那穆尔蒂和詹妮弗·雷克斯福德。 Web协议与实践艾迪森·韦斯利2001年[8] M. Ajmone Marsan,G. Balbo,G. Conte,S. Donatelli和G.弗兰切斯基尼斯用广义随机Petri网。并行计算中的Wiley系列John Wiley and Sons,1995年。[9] Marcel F.中性。随机模型中的矩阵几何解:数学方法。约翰·霍普金斯大学出版社,1981年。[10] P. Reinecke , A.van Moorsel 和 K. 沃 尔 特 应 用 层 重 启 动 与 传 输 协 议 相互 作 用 的 测 量 研 究 在procInternational Service Availability Symposium ( ISAS ) , number 3335 in Lecture Notes inComputer Science,Munich,Germany,May 2004. 斯普林格。[11]P. Reinecke,A. P. A. van Moorsel和K.沃尔特快速和公平:一个故障注入驱动的重启Oracle的比较可靠的Web 服 务 。 在 Proc.3rd International Conference on the Quantitative Evaluation of SysTems(QEST)2006中,Riverside,CA,USA,2006年9月。美国电气与电子工程师协会。22K. Wolter,P.Reinecke/Electronic Notes in Theoretical Computer Science 261(2010)5[12] P. Reinecke和K.沃尔特Web服务可靠消息中重启策略的适应性度量和性能。第七届软件性能国际研讨会(WOSP),普林斯顿,新泽西州,美国,2008年6月。出现。[13] P. Reinecke和K.沃尔特Web服务可靠消息传递中消息传输时间的阶段型近似。在Proc.SPEC国际性能工程研讨会(SIPEW),LNCS第5119卷,Darmstadt,德国,2008年6月。史普林格出版社出现。[14] Philipp Reinecke,Sebastian Wittkowski,and Katinka Wolter.使用sun java adventure builder测量响应时间。第一届面向服务的软件系统质量国际研讨会(QUASOSS),荷兰阿姆斯特丹,2009年8月26日。[15] 太阳微系统公司JavaAdventureBuilder参考应用程序。https://adventurebuilder.dev.java.net/,2006.最后一次出现是在2009年4月28日。[16] AxelThummlelr,PeterBuchholz,anddMicklo s Telek.一种新的P型滤波器采用EM算法。IEEE跨部门安全Comput. ,3(3):245[17] M. Telek和A.亨德尔二阶非循环离散和连续相型分布的匹配矩。International Journal of SimulationSystems,Science Technology,3(3[18] A. P. A. van Moorsel和K.沃 尔特 “完 成时 间 瞬 间的 最 佳重 启 时 间 ”。 IEE Proceedings Software, 151(5),2004.[19] Aad P. A.范·莫塞尔和卡廷卡·沃尔特。分析软件系统中的重启机制。IEEE软件工程学报,32(8):547[20] K. 我会的。 Self-系统管理员需要对数据恢复进行管理。 InOzalpBabaoglu,MrkJelasity,AlbertoMontresor,Christof Fetzer,Stefano Leonardi,Aad van Moorsel,and Maarten van Steen,editors,Self-Star Properties in Complex Information Systems,volume 3460 of Lecture Notes in ComputerScience. Springer-Verlag,2005.[21] 卡廷卡·沃尔特容错随机模型--重启、恢复和检查点。Springer Verlag,2010.
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 构建基于Django和Stripe的SaaS应用教程
- Symfony2框架打造的RESTful问答系统icare-server
- 蓝桥杯Python试题解析与答案题库
- Go语言实现NWA到WAV文件格式转换工具
- 基于Django的医患管理系统应用
- Jenkins工作流插件开发指南:支持Workflow Python模块
- Java红酒网站项目源码解析与系统开源介绍
- Underworld Exporter资产定义文件详解
- Java版Crash Bandicoot资源库:逆向工程与源码分享
- Spring Boot Starter 自动IP计数功能实现指南
- 我的世界牛顿物理学模组深入解析
- STM32单片机工程创建详解与模板应用
- GDG堪萨斯城代码实验室:离子与火力基地示例应用
- Android Capstone项目:实现Potlatch服务器与OAuth2.0认证
- Cbit类:简化计算封装与异步任务处理
- Java8兼容的FullContact API Java客户端库介绍
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功