RAID系统性能模型的标定及其对磁盘访问时间的理论计算机科学研究

144 浏览量更新于2024-01-16 收藏 730KB PDF 举报

建模方法

排队模型

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

理论计算机科学电子笔记128（2005）145-164www.elsevier.com/locate/entcs一种RAID系统性能模型的标定Peter G.Soraya Zertalb，2一伦敦帝国理工学院，南肯辛顿校区，伦敦SW7 2AZ，英国BP Ri SM，Ui versitedeVersailles，45，Av. desEtats-Unis，78000Versailles，法国摘要最近的一个基于磁盘阵列的RAID系统建模方法比较了两种最常见的变体RAID 0 -1和RAID 5的平均磁盘访问时间，以及它们共存的多RAID系统。对于每个逻辑（用户）请求，对多个磁盘的访问同时发生，并且仅当所涉及的每个磁盘都完成时才完成。因此，模型需要估计单个磁盘响应时间的最大值的平均值，每个响应时间由M/G/1队列的等待时间建模。这个平均-最大值近似于磁盘服务时间的第二时刻，而第二时刻又需要磁盘服务时间的第三时刻，磁盘服务时间本身是寻道时间、旋转延迟和块传输时间的函数。为了与物理硬件和系统软件的事件驱动模拟器保持一致的良好一致性，需要仔细校准所得到的模型参数并验证其假设。该校准和验证过程涉及子模型的详细分析，以揭示对促进可行的预测模型的真实世界操作参数的域的必要限制。该过程产生了对所涉及的几个抽象子系统的重要见解，这些子系统可用于一系列实际建模研究;例如，通过一组相同的独立队列来近似一组具有同步到达的并行队列的效果。与硬件模拟器的最终比较显示出良好的一致性，远远超过了原始模型。保留字：排队模型，RAID系统，平均响应时间1介绍本文作者提出的RAID（独立磁盘冗余阵列）系统的最新模型[7，11]是基于一个简单的概念，即一个col-1，1 电子邮件地址：pgh@doc.ic.ac.uk2电子邮件：zertal@prism.uvsq.fr1571-0661 Crown版权所有© 2005由Elsevier B. V.出版。CC BY-NC-ND许可证下开放访问。doi：10.1016/j.entcs.2005.01.017146P.G. Harrison，S.Zertal/Electronic Notes in Theoretical Computer Science 128（2005）145选择M/G/1个队列，每个队列对应于阵列中的每个磁盘。因此，主要的建模问题是如何选择在每个磁盘（对应于“G”）的服务时间分布前者已经被广泛考虑。我们使用磁盘硬件规格，如磁盘旋转速度和磁头横向移动速度和加速度，以及给定的磁盘I-O请求大小分布，假设通过profiling估计事实上，出于测试目的，我们假设请求由固定数量的块组成。关于第二个问题，同步之间的磁盘访问，因此并行响应时间的相关性对多个磁盘的访问同时发生，并且只有当涉及的每个磁盘都完成时才完成-一个“fork-join”体系结构。我们首先假设，访问时间是代表每个被访问磁盘的独立M/G/1队列集合中的最大响应时间。其次，我们假设这个最大值的平均值可以通过[ 7 ]中导出的新的“平均值-最大值”公式精确地近似在[7]中研究了平均值-最大值公式的准确性，发现除了服务时间的方差较低时第二个问题是泊松到达的假设。在许多建模研究中，已经发现这种假设是相当稳健的，通常是因为总到达过程很好地近似于独立的稀疏更新过程的叠加，其中大量的过程可以渐近地接近泊松过程。本文讨论了该RAID模型中使用的参数化、假设和近似，并确定了用于参数化的随机变量的分布限制，以获得可靠的预测。在下一节中，RAID系统和RAID模型将被简要概述，读者可以参考以前的出版物了解详细信息。在第3节中，将模型的数值结果与模拟结果进行了比较，并确定了一致性恶化的敏感区域。然后，在第4节中对上述可能的误差来源进行了独立调查。2RAID系统和型号RAID存储系统由磁盘系统管理器和独立磁盘的集合（阵列）组成。磁盘系统管理器是一个软件组件;它接收来自系统用户（通常是许多用户）的请求。这些请求被认为是合乎逻辑的，因为它们完全独立于P.G. Harrison，S.Zertal/Electronic Notes in Theoretical Computer Science 128（2005）145147λ'2......λ'CLλ1λ2RAID控制器...λN我λ存储系统的物理配置来自不同用户的请求以不同的速率λJ到达，1 ≤ i ≤ Cl。磁盘系统管理器将数据细分为称为条带单元的数据块，并将它们分布在集合中。磁盘的作用。因此，对于每个逻辑请求，它生成许多物理请求并将它们发送到关联的磁盘。数组中的每个磁盘i以如图1所示的速率λi接收请求，1≤i≤N。最后，磁盘系统管理器等待来自每个被请求的磁盘的（物理）响应，以构造对每个逻辑请求的（逻辑）响应，然后将其发送给相应的用户。“的User 11用户2盘1盘2用户U盘NFig. 1. RAID存储系统根据磁盘上的数据放置/冗余模式执行请求细分和分发过程事实上，有各种各样的RAID级别3对应于这些模式[4，5]，但我们感兴趣的是两个最常见和最有用的：RAID 0 -1和RAID 5。2.1RAID级别在RAID0-1级别中，同时使用阴影（完全冗余）和条带化磁盘集合分为两组：本机磁盘和镜像磁盘，它们都细分为条带单元。所有数据都在本机磁盘和镜像磁盘上进行复制和分发。读取物理请求被发送到本机磁盘或镜像磁盘，而写入物理请求被发送到它们两者，以保持本机和镜像数据的一致性。在RAID5级别，块条带化和基于奇偶校验的冗余被用于以低成本提高逻辑请求处理速率方面的性能。冗余单元以循环方式分布在磁盘上。因此，冗余盘用于每个条带4，这增强了冗余性。写3RAID级别的特征在于特定的数据/冗余放置方案。4条带是存储在磁盘子集上的本机数据块（条带单元）和存储在另一个磁盘上的冗余块磁盘系统管理器148P.G. Harrison，S.Zertal/Electronic Notes in Theoretical Computer Science 128（2005）1452.2RAID备份模型正如在引言中已经指出的，整个RAID模型基于M/G/1队列，该队列具有各种扩展，以考虑对应于逻辑请求的并行磁盘访问的fork-join性质每个物理请求对单个磁盘的响应时间由四个部分组成：在磁盘队列中等待启动服务所花费的时间（Q），寻道时间（S），旋转延迟（R）和传输时间，我们将其分为两个部分，T和t，分别对应于从磁盘的缓冲器（通过总线）传输服务器在磁盘M/G/ 1队列中的服务时间是这些组件中最后三个的总和，并根据硬件参数、为寻道时间选择的特定模型和物理块大小分布进行计算出作为M/G/1模型的输出的热分解分量。到达服务器的速率根据逻辑请求到达率、纯工作负载参数和RAID变量（假设对磁盘的访问一致）计算。逻辑请求的访问时间被定义为所有物理请求访问时间的最大值;我们需要这个数量的期望值。在物理请求访问时间是独立的近似假设下，通过[7]的平均值-最大值公式估计，如下所示。n个独立的非负随机变量的最大值的期望值，平均值为m =（m1，.，mn），α =（m−1，.，m-1）和第二个mo-1N项M =（M1，.，Mn）近似为函数I（n，α，M），由递归定义（一）I（k，α，M）=1克朗KI（k−1，αI，MI）+αiMiLk−1（αI，αI）/2i=1I（1，α1，M1）= 1/α1对于k = 2，…，n，其中α1，..，αi−1，αi+1，...，αn），M\i类似，Lk−1（α\i，s）是k − 1个指数随机变量的最大值的概率密度函数的拉普拉斯变换，参数为α\i。证明了当所有随机变量均为指数型时，这一结果是精确在所有参数都相等的特殊情况下，假设αi=α且Mi=M（1≤i≤n），则有Lk−1（α\i，αi）= 1/k，因此I（k，α，M）=I（k−1，α，M）+Mα2KP.G. Harrison，S.Zertal/Electronic Notes in Theoretical Computer Science 128（2005）145149并且因此I（k，α，M）= 1/α+（Mα/2）克I=21/I对于每种访问类型（读或写）、RAID变体和几个请求大小范围，计算参与磁盘的数量以及它们的M/G/1模型的参数，在下一节考虑的数值示例中。复杂的细节出现在[7，11]。participating磁盘的数量决定的数量，n以上，随机变量最大化，然后平均。3结果为了验证我们的模型并评估其准确性，我们开发了一个详细的事件驱动的模拟器。这个模拟器是用C语言编写的，由三个主要部分组成。第一部分是逻辑请求生成器，它使用标准随机数生成函数来生成具有任意概率分布的请求间第二部分是逻辑到物理的映射，它包含所有物理请求生成函数。这部分涉及不同的访问模式和速率的物理请求对应的冗余（RAID级别）与其请求的存储区域。第三部分是模拟引擎，它调度磁盘（的操作抽象）上的物理请求的执行并管理同步。我们从一个库中获取硬件参数，将其从执行例程中分离出来，以增强模拟器的可扩展性和可扩展性。我们生成的工作负载具有不同的平均逻辑请求大小（以每个4KB的块为单位测量），使用1、4和8个块的大小来表示最小和中小请求。使用更大的大小（高达250个块）来表示中型到大型的请求也很有趣。事实上，对于在图像应用程序中观察到的大型请求，上限是1MB。我们丢弃了如此大的请求，因为处理它们的应用程序不使用这里考虑的RAID级别，而是使用RAID3。考虑到工作负载中读取和写入之间的平衡，我们生成了具有三个比率的模型输入：面向写入的工作负载的25%的读取、面向读取的工作负载的75%的读取和专门读取的工作负载的100%的读取。对于本文中给出的结果，我们使用了16个磁盘的阵列。我们使用的圆盘的特性是：圆柱数C =1200;全旋转时间RMAX= 16。7ms;每个磁道的块数（bpt）= 12;加速时间a = 3 ms;寻道因子b = 0。5和一个块传输时间T = 1。34毫秒我们选择这个参数化是为了比较150P.G. Harrison，S.Zertal/Electronic Notes in Theoretical Computer Science 128（2005）145结果与[3]中的结果一致。测试更现代的磁盘所需的任何修改都很简单，更先进的架构，例如根据柱面具有可变扇区大小，可以通过适应模型来处理。请注意，我们模拟的是真实RAID系统的物理操作，而不是上一节中考虑的抽象模型所有服务时间都取自系统的运行特性，这些特性在模拟中明确建模并在分析模型中汇总。为了验证我们的分析模型，我们首先假设逻辑请求的外部泊松到达，然后通过考虑第4节中的非指数到达间隔时间来验证这一假设。模拟运行了300000逻辑请求的预热期，以使系统达到稳定状态。然后，他们又运行了700000个逻辑请求，在此期间收集了有关响应时间的测量结果置信带非常窄，但在此省略。然而，在模拟和分析模型之间存在好的一致性和差的区域是明显的。图2至图7比较了分析模型预测的平均响应时间与在RAID 0 -1和RAID 5冗余级别下针对最小、中小型请求大小以及针对读写磁盘访问的递减比率（1、0.75和0.25）进行模拟获得的平均响应时间。对于只读访问，模型和模拟响应时间在图2至图7中显示了在所考虑的整个请求大小范围内以及对于RAID 0 -1和RAID 5的极好的一致性。与图3和5相比，RAID 0 -1在图2和图4上的小请求大小1和4上更优越，其中RAID 5基于冗余和条带化的方案的额外复杂性导致惩罚而不是好处。与图6和图7相比，我们可以看到系统在小型和中型请求大小环境中的行为。我们推断，工作负载阈值（超过该阈值，性能会迅速下降到不可接受的水平）随着平均请求大小的增加而显著降低;这里RAID 5的系数约为10，RAID 0 -1的系数约为2。因此，RAID5在小请求上比RAID0-1受到更多的惩罚，这表明在更大的请求大小上存在随着写访问的比例在2002年增加到2007年，协议仍然很好，但在高负载（即高逻辑请求到达率）下会恶化，特别是对于RAID 5。在这个区域中，近似假设要接受更严格的检验，响应时间的延迟分量占主导地位。我们定量地考察了它们的相对效应P.G. Harrison，S.Zertal/Electronic Notes in Theoretical Computer Science 128（2005）145151但是在这里注意，我们仍然可以准确地预测过度负载的开始（上面提到的最后两对图（图8和图9）显示了RAID分区大小之间的比例选择对整个存储系统性能的影响互补的分区选择（图8中75%的RAID 0 -1和25%的RAID 5，图9中25%的RAID 0 -1和75%的RAID5）显示了响应时间如何由较大的分区主导。请注意，给定的存储空间比例（分区大小）意味着该分区的传入请求比例相等。也就是说，分区工作负载与其大小成比例在图9中，75%的工作负载被分配给RAID 5，其中，由于请求大小很小（一个块），重新分组策略（如完整/大型写入）是不必要的。因此，这些代价高昂的写操作（每一个写操作生成4次磁盘访问）导致了比图8的混合系统更高的响应时间，在图8的混合系统中，写操作受到的惩罚更少，因为只有25%被分配给RAID 5。2502001501005000 100 200 300 400 500 600 700 800lambda（req/s）图二. RAID1 B=14近似的来源在我们的模型中，我们首先考虑的最明显的不准确候选来源是第2.2节的均值-最大值近似，它只对并行指数延迟是精确的。然而，还有其他潜在的原因，ANAApr1SIMpr1ANAApr.75SIMpr.75ANAapr.25SIMpr.25平均响应时间（ms）152P.G. Harrison，S.Zertal/Electronic Notes in Theoretical Computer Science 128（2005）1452502001501005000 100 200 300 400 500 600 700 800lambda（req/s）图三. RAID5 B=12502001501005000 20 40 60 80 100 120 140 160 180lambda（req/s）见图4。 RAID1 B=4不准确性，我们也将在本节中解决：单个磁盘上响应时间的不准确近似，我们认为是一个M/G/1队列，服务时间由特定的公式给出，寻找时间和旋转延迟，以及这些响应时间之间的依赖关系。ANAApr1SIMpr1ANAApr.75SIMpr.75ANAapr.25SIMpr.25ANAApr1SIMpr1ANAApr.75SIMpr.75ANAapr.25SIMpr.25平均响应时间（ms）平均响应时间（ms）P.G. Harrison，S.Zertal/Electronic Notes in Theoretical Computer Science 128（2005）1451532502001501005000 20 40 60 80 100 120 140 160 180lambda（req/s）图五. RAID5 B=42502001501005000 10 20 30 40 50 60 70 80 90lambda（req/s）见图6。 RAID1 B=8我们还调查了泊松到达的假设的鲁棒性，通过比较我们的结果与模拟具有非泊松到达。ANAApr1SIMpr1ANAApr.75SIMpr.75ANAapr.25SIMpr.25ANAApr1SIMpr1ANAApr.75SIMpr.75ANAapr.25SIMpr.25平均响应时间（ms）平均响应时间（ms）154P.G. Harrison，S.Zertal/Electronic Notes in Theoretical Computer Science 128（2005）1452502001501005000 10 20 30 40 50 60 70 80 90lambda（req/s）见图7。 RAID5 B=82502001501005000 100 200 300 400 500 600 700 800lambda（req/s）见图8。 RAID0-1 = 75% RAID5 = 25%4.1平均值-最大值近似为了评估其准确性，我们将第2.2节的平均值-最大值公式与N个独立同分布的最大值的模拟进行了ANAApr1SIMpr1ANAApr.75SIMpr.75ANAapr.25SIMpr.25ANAps0pr1SIMpr1ANAps0pr.75SIMpr.75SIMpr.25ANAps0pr.25平均响应时间（ms）平均响应时间（ms）P.G. Harrison，S.Zertal/Electronic Notes in Theoretical Computer Science 128（2005）1451552502001501005000 100 200 300 400 500 600 700 800lambda（req/s）见图9。 RAID0-1 = 25% RAID5 = 75%两种类型的随机变量：Erlang和Pareto。模拟运行了100，000次，给出了0.01阶的98%置信区间。将每个检验分布标准化为单位平均值，以便仅通过二阶矩确定近似平均值-最大值请注意，即使方差为零，二阶矩也是均值的平方，即1。因此，近似因此，对于N个确定性随机变量，这里每个随机变量都等于1，概率为1，精确的均值-最大值是1，而近似值发散到无穷大。因此，近似值不适用于小方差。这在表1中进行了说明，其中对Erlang- 2，Erlang-3和Erlang-4分布进行了测试。一个k相的Erlang-k分布的均值是k/λ，因此我们选择λ=k。因此，方差为k/λ2= 1/k，当k → ∞时趋于零。因此，近似如我们从表1中看到的，在较大的k处恶化。的二阶矩k相位Erlang是1 + 1/k，我们看到16个并行Erlang的误差为36%， 4随机变量每个变量的方差均为0.25，因此我们发现超过8个平行随机变量在适度小的方差下一致性较差-所有都如预期的那样高估。然而，对于多达4个并行，准确性是相当可以接受的;这发生在从镜像磁盘读取和RAID访问少量块时。表中每行还包括N个平行指数随机变量的最大值的平均值ANAps0pr1SIMpr1ANAps0pr.75SIMpr.75ANAps0pr.25SIMpr.25平均响应时间（ms）156P.G. Harrison，S.Zertal/Electronic Notes in Theoretical Computer Science 128（2005）145每一个都有单位参数。从2.2节可以看出，这只是N次谐波数，可以看出它严重高估了;比16个并行Erlang-4分布的最佳情况下的误差增加了一倍多NExp-1ModErlang-2SIM%误差ModErlang-3SIM%误差 ModErlang-4SIM%误差11.0001.0001.003-0.3341.0000.9990.0621.0000.9990.06021.5001.3751.3730.1351.3131.2713.2811.2811.1957.20742.0831.8131.7722.2651.6771.5468.4481.6091.38016.6482.7182.2882.1824.8812.0741.80614.841.9661.55526.43163.3812.7862.5887.6482.4882.06120.742.3391.71636.30表1与Erlang的比较（低方差）然而，在实践中，排队等待时间往往不会有很低的方差-如果他们这样做，可能会更容易预测。因此，我们测试了接近相反极端的近似精度，对高方差，重尾帕累托分布。这些人再次被选中在原点处具有单位均值和零分布函数。所选分布的形式为FP（x）= 1−α（x+γ）−β，其中β >2的前两个矩是有限的。为了通过原点并具有单位均值，我们需要α=γβ和γ=β− 1。这给出了二阶矩M2= 2 + 2/（β−2），我们用它来参数化近似。我们称具有这些性质的帕累托分布为帕累托-β，并将我们的近似与帕累托-4和帕累托-5随机变量的平均最大值的模拟进行比较;见表2。NExp-1ModPareto-4SIM%误差Mod帕累托5SIM%误差11.0001.0001.004-0.3811.0000.9940.61421.5001.7501.57910.821.6671.5676.35042.0832.6252.32712.812.4442.2697.74482.7183.5773.2619.6983.2903.1295.173163.3814.5714.3944.0274.1744.1530.512表2与Pareto比较（高方差）P.G. Harrison，S.Zertal/Electronic Notes in Theoretical Computer Science 128（2005）145157可以看出，这里的一致性比低方差情况要好得多。事实上，近似值在适度小的并行数（N）时最差，当N达到16时有所改善。正如预期的那样，随着参数β的增加，近似值得到改善，给出更接近指数1的更低方差。指数均值-最大值在此表中重复出现，并显示低估，再次如预期的那样，因为帕累托二阶矩大于均值为1的指数随机变量的二阶矩，即2。还记得，当这些等待时间是指数时，递归是精确的。实际上，如果等待时间是相位型的，则其最大值的平均值也可以精确计算，最大值也是相位型的。该计算在N中具有指数复杂性，但在[1]中得到了一个有效的多项式近似。这可以用在我们的情况下是太不准确，例如低方差Erlang分布，相位类型的一个特殊情况。我们的结论是，只有当变异系数（标准差与平均值之比）远小于1时，近似值才可能很差。幸运的是，这是最不可能的情况，文件访问时间是众所周知的可变的，有时甚至具有厚尾分布。4.2单个圆盘现在，我们评估通过用M/G/1队列中的响应时间来近似单个磁盘上的物理请求所经历的延迟所引入的误差这是一个相对简单的计算响应时间，因为它排除了等待与并行请求同步以完成“加入”操作的任何额外延迟。然而，它是至关重要的一个组件的延迟最大化，本身是由服务时间的M/G/1队列。因此，我们首先考虑这一点。4.2.1服务时间服务时间X定义为寻道时间S、旋转延迟R和传输时间K（T+t）之和，其中K是传输的块数。我们写Y=S+R和X=Y+K（T+t）以与前面的符号保持一致。传输时间分量的精度没有问题，因为T和t是已知的常数，K是我们实验中的控制参数。因此，我们比较了分析模型和模拟模型中的随机变量S、R及其和Y。这些显然与逻辑请求的到达率λ和其他工作负载特征（如请求大小）无关。我们在我们的模型中使用这些量的前三个矩，因此将它们的解析计算值（参见[7，11]）与模拟运行中的估计这是通过简单地划分158P.G. Harrison，S.Zertal/Electronic Notes in Theoretical Computer Science 128（2005）145将模拟量的i次幂乘以模拟器生成它的次数（小于1），以估计第i个矩，i=1， 2， 3。为了分离高阶效应并进行一致的比较，我们使用了中心i阶矩，当i> 1时，提高到i− 1的幂;这给出了i = 2时的标准差。我们获得了以下结果，如表3所示：模型仿真平均值（1）20.5820.54标准差（2）6.156.11三次中心8.452.32表3服务时间分量Y=S+R的寻求模型时间S仿真Lat模型恩塞河仿真平均值（1）12.2312.228.358.32标准差（2）3.823.854.824.74三次中心8.452.100.020.71表4寻道时刻和延迟时间的比较我们看到，该协议是好的均值和标准差。三阶中心矩的立方根的差异来自下表中总结的三阶矩：延迟R寻道时间SSe服务时间Y模型仿真%误差模型仿真%误差模型仿真%误差1142.671139.530.2741765.262363.69-33.910457.710970.9-4.9路比较3表5等待时间、寻道时间和服务时间的时刻现在的问题是，当响应时间可能由许多服务时间随机变量组成时，响应时间在更高负载下的匹配情况如何P.G. Harrison，S.Zertal/Electronic Notes in Theoretical Computer Science 128（2005）1451594.2.2单圆盘上的瞬时为了能够使用2.2节的近似均值-极大值公式，我们需要速率α，Q+Y的倒数，以及相应的二阶矩M2=Q+2QY+Y。这需要在婚礼的前两个时刻时间Q，由服务时间的前三个时刻给出的用于Q的时刻的公式需要关于物理盘的操作的假设（与寻道时间和旋转等待时间有关），并且依赖于M/G/1队列的标准属性因此，我们接下来绘制图表O.f个平均排队时间Q和排队时间的标准差2（Q-Q）与单个逻辑请求的外部到达率λ的关系磁盘，用于各种请求大小和RAID级别。请注意，在λ非常小的情况下，扰动的影响可以忽略不计，我们只是评估我们关于圆盘运行的假设的准确性。随着λ和请求大小B的增加，这种阻塞效应变得很重要，从而导致磁盘拥塞，如图10所示。2502001501005000 100 200 300 400 500 600 700 800lambda（req/s）见图10。同步时间Moments（RAID 0 -1，pr=1）正如预期的那样，我们确实观察到，服务时间矩计算的不精确性在服务时间矩中放大，增加了我们平均响应时间计算的误差。实际上，在与相应的平均响应时间图相同的载荷下，响应时间矩的差异增加得更快这在第二时刻的情况下尤其如此。Q_bar B=1Q_stddev B=1Q_bar B=4Q_stddev B=4平均响应时间（ms）160P.G. Harrison，S.Zertal/Electronic Notes in Theoretical Computer Science 128（2005）1454.3并行队列下一个问题是队列之间的依赖性，这是由逻辑请求产生的物理请求的同步到达引起的。我们不能假设响应时间的集合是独立的，我们估计最大值的平均值。例如，如果服务时间是恒定的并且到达是同步的，即，总是在一组磁盘中的每个磁盘上同时发生因此，无论RAID系统中有多少个磁盘，最大响应时间都是单个磁盘的响应时间。如果每个同步并行请求的服务时间相同，则这同样适用于任何服务时间分布然而，我们的平均-最大近似值会随着磁盘数量的增加而发散（数学上），从而产生无限误差！这基本上是我们在4.1节中考虑的低方差情况，但在这里它意味着我们不能忽略到达之间的依赖性，即使我们在实践中不太可能遇到这种极端的情况，因为磁头的异步定位和逻辑请求的交错只需要RAID阵列的子集，甚至一个磁盘。分析评估似乎是不可能的，首先需要在任意数量的队列上联合分布队列长度，然后使用补充变量或可能找到一些嵌入的马尔可夫链（如单个M/G/1队列）对响应时间进行多维分析。因此，我们再次使用模拟。对各种服务时间分布G进行了以下实验，包括指数分布、Erlang分布、确定性分布（常数）和帕累托分布（参数取自第4.1节中使用的集合，均为单位均值）：• 对于N= 2、 4、 8、 16，计算 N个独立的M/G/1队列（与我们的模型完全相同），每个队列的到达率为λ（对于不同的λ）;• 对于相同的N值集，计算相同的N个完全同步的M/G/1队列这两种情况代表了可观察到的行为的极端情况。在实践中，并非所有磁盘都将涉及每个请求，从而导致异步行为，人们希望通过假设相互依赖来更好地近似异步行为。从表6和表7中，我们观察到，除了高阶Erlang和确定性之外，P.G. Harrison，S.Zertal/Electronic Notes in Theoretical Computer Science 128（2005）145161NExp工业部Erlang-2工业部Erlang-4工业部21.621.621.471.461.351.3442.262.231.901.871.651.6282.952.892.341.291.951.89163.663.582.802.712.252.15表6与Erlang的NPareto-4工业部帕累托5工业部恒定工业部21.771.771.731.721.081.0442.612.622.532.511.151.0483.733.683.513.461.281.04165.064.964.664.571.471.04表7Pareto与Constant的(unit响应时间）情况下，具有小的方差（在后一种情况下为零）。这与我们在第4.1节中的观察结果一致。4.4非泊松到达对于我们的最终测试，我们放松了泊松到达要求，通过简单地使用交替到达过程的模拟。这些都是参数化的，这样我们就可以用同一组平均到达率λ来绘制与第3节类似的图。我们使用以下到达间隔时间分布，每个分布的平均到达间隔时间为1/λ：Erlang-n（n，λ）forn = 2， 4; generalizedexponentialGE（p，pλ）=1−pe−pλt，其中p=0。5和2相电流中断生成矩阵为Q=−11的Poisson过程IPP（Q，2λ）1−1调幅到达率为0和2λ的GE分布给出具有几何大小的批次的泊松到达（p= 1给出单位批次，如在泊松过程中，较小的p162P.G. Harrison，S.Zertal/Electronic Notes in Theoretical Computer Science 128（2005）145给出较大的批次），IPP给出相关的流量。我们发现平均响应时间对到达间隔时间的特定分布相当不敏感，仅对其平均值（即，仅限于我们可以在图11中看到，GE和IPP曲线略微位于顶部，这是可以预测的，因为这种分布具有突发/批量特性。然而，在高到达率下，对于泊松到达分布，差异分别为响应时间的2.29%和7.33%（对于GE和IPP）。事实上，泊松到达假设经常被发现是鲁棒的，特别是对于建模外部的、用户生成的逻辑请求，因为这种外部传输通常由许多独立行为的低强度流组成。在相当温和的假设下，这种稀疏流的叠加可以近似为泊松过程2502001501005000 100 200300400 500 600 700 800lambda（req/s）见图11。Poisson与非Poisson到达分布5结论我们系统地构建了两个RAID存储系统的分析模型，RAID0-1，RAID5和一个多RAID，其中RAID0-1和RAID5核心存在，基于其组成部分（硬件和软件）的详细子模型，并验证了他们对显式模拟的详细操作。这些模型并不是新的，我们的贡献是我们通过微调Erlang-2Erlang-4葛泊松IPP平均响应时间（ms）P.G. Harrison，S.Zertal/Electronic Notes in Theoretical Computer Science 128（2005）145163那些没有给出足够代表性的部分分析结果与模拟进行了比较，在一个非常精细的抽象层次，并显示出非常好的协议，在低-中等负载的范围内的请求大小和读写访问率。此外，该模型预测饱和的开始，即。负载水平高于该水平时响应时间迅速增长到不可接受的水平，从而导致不良的服务质量除此整体比较外，本集团亦仔细检查分析模型的特定假设，并找出导致不准确的最严重原因。我们考虑• 平均值-最大值近似的准确性，这是模型的核心;• 基于标准子模型，我们对寻道时间和旋转延迟的估计精度，以及它们对搜索时间的复合效应;• 并行fork-join队列之间的同步效果我们的结论是，不准确的主要原因是第一和第三个原因，只有当磁盘服务时间相当一致并且相对可预测时，即具有较小的差异时，影响才会严重。这在今天的磁盘访问模式中是很少见的我们还检查了外部请求作为泊松流到达的假设的鲁棒性，发现平均响应时间只对到达率敏感，而不是对到达间隔时间的特定分布敏感。在计算一组独立随机变量的最大值的均值时，一般来说，第2.2节的速率和二阶矩参数αi，Mi是不同的。在本研究中，我们假设参数相等，从而得到一个简单的非递归结果，但需要进行受控实验，以确保每个磁盘上的所有工作负载参数都相同。事实上，物理请求的磁盘选择概率对工作负载变化和RAID级别的选择特别敏感一般计算的优化，特别是当参数落入对应于相同磁盘的子集的类中时，是正在进行的工作的主题。进一步考虑平均值-最大值计算中的误差程度也很重要特别是对于低方差，可以使用[1]的方法与位相型情况下的精确结果进行比较，参见。实际上，在小型模型中，可以使用相型方法本身。最后，我们将研究扩展到动态和异构存储系统，处理布局方案和重新配置所需的164P.G. Harrison，S.Zertal/Electronic Notes in Theoretical Computer Science 128（2005）145RAID方案，可适应其不断变化的操作负载。这项工作还包括表示更大的请求大小。然后，我们将能够评估相关数据迁移和通信的开销。引用[1] 博嫩坎普和B. Haverkort，最大值的平均值，在：Proc. PAPM/PROBMIV 2002，计算机科学讲义2399，Springer-Verlag，pp. 37-56，2002年。[2] 陈淑仪，“高性能的设计、建模和评估”，博士论文，马萨诸塞大学，（美国）（1992年）。[3] Chen，S.和D.张文龙，磁盘阵列架构的效能评估，载于：IEEE计算机学报，1997年。[4] D. A. Patterson，G. G.和R. H. Katz，廉价磁盘冗余阵列（RAID）的案例，在：SIGMOD会议论文集，1988年。[5] D. A. Patterson ， G. G. ， P. M. Chen 和 R. H. Katz ， Introduction to Redundant Array ofCheapful Disk（RAID），in：IEEE COMPCON，1989.[6] Gravey，A.，A simple construction of an upper bound for the mean of the maximum of nidentical distributed random variables，Journal on Applied Probability（1985），pp. 844-65.[7] Harrison，P. 和S.林志玲，服务时间最大化模型的建立，载于《工具会议论文集》，2003年。[8] Lee，E.和R. H. Katz，磁盘阵列的分析性能模型及其应用，在：技术报告UCB/CSD 92/660，1991年。[9] RAID咨询委员会，[10] Zertal，S.，“多磁盘存储系统上存储定制的动态冗余机制”，博士。法国凡尔赛大学论文（2000年）。[11] Zertal，S.和p.Harrison，Multi-level RAID storage system modeling，in：Proceedings of2003InternationalSymposiumonPerformanceEvaluationofComputerandTelecommunication Systems（SPECTS），2003。

下载后可阅读完整内容，剩余1页未读，立即下载