没有合适的资源?快使用搜索试试~ 我知道了~
嵌入式网络在数据库设计性能评价中的应用
理论计算机科学电子笔记232(2009)101-124www.elsevier.com/locate/entcs嵌入式网络模型在数据库设计性能评价中的应用放大图片作者:Michael E.伍德沃德1英国西约克郡布拉德福德大学计算机系摘要在本文中,我们模型数据库设计使用嵌入式网络,使数据库设计的动态行为的可见性,并允许数据库设计人员进行实验与不同的设计决策。 我们的方法是抽象出数据库系统设计的更详细层次,数据库设计人员在设计时可用的信息。 它与其他数据库系统性能评估方法的不同之处在于,性能评估专门针对数据库设计,而不是数据库系统软件架构。 我们提出了一个瓶颈评估的事务处理性能委员会TPC-C基准在不同的工作负载条件下,并演示了这是如何影响数据库设计决策。关键词:数据库设计性能,嵌入式网络。1介绍嵌入式网络在数据库(DB)系统和数据库管理系统(DBMS)性能评估中的应用一直是在数据库领域[32]的DBMS组件性能和性能工程领域[3]的软件系统架构和设计模型的背景下。性能评估数据库设计,如本文所述,据我们所知,以前没有得到解决。传统的软件测试和性能评估方法对数据库设计评估没有帮助,主要是因为软件测试关注系统的功能性[23,30]以及它符合其要求的程度性能需求通过软件性能工程技术进行测试[29],但这些技术同样关注整个系统的功能。1电子邮件:r.i.m. bradford.ac.uk,i.u. bradford.ac.uk,m.e. bradford.ac.uk1571-0661/© 2009 Elsevier B. V.根据CC BY-NC-ND许可证开放访问。doi:10.1016/j.entcs.2009.02.053102R. Osman等人理论计算机科学电子笔记232(2009)101如[28]、[29]和[3]中所示,没有对数据库内部发生的更改及其对整体系统性能的影响进行任何调整。这一现实阻碍了在早期设计阶段评估数据库系统性能的任何尝试,从而促进了部署后调优的采用而且,商业数据库性能调优工具提倡部署后调优.这些工具依赖于查询优化器和来自工作生产数据库的统计数据,以提供性能改进的建议[2,7,36]。据我们所知,没有用于数据库设计的性能评估工具。随着带有后端数据库的全天候基于Web的电子服务应用程序的出现,不可接受的性能和不可用性带来了高昂的代价。此外,部署后的数据库性能调优是数据库系统总拥有成本的主要贡献者[35]。因此,不能再忽视数据库设计的性能除了在早期开发生命周期阶段[29]普遍接受软件系统性能评估的高度影响外,数据库设计的性能评估方法具有以下优点:• 防止设计问题传播到数据库系统的详细设计和实现阶段;• 简化了数据库设计人员和应用程序开发人员的工作;性能评估反馈与开发过程的当前状态相关,从而避免了更改需求或应用程序设计的昂贵回溯;• 在数据库设计过程以及软件开发过程中集成性能评估;• 有助于最大限度地减少部署后的数据库系统性能调优。本文的目的是建立我们的方法的有效性,有效地建模数据库设计的第一步,实现一个完整的框架,数据库设计和数据库系统的性能评估。在[21]中,我们建立了专门针对数据库设计的性能评估模型的必要性的论点。在[20]中,我们已经证明了嵌入网络模型适用于数据库设计。这是通过验证交易处理性能委员会TPC-C基准测试的网络模型与基准测试的实现(即[9],[10],[14],[15]和[5])来证明的。在本文中,使用TPC-C基准测试,我们扩展了[20]中提出的工作,以包括更现实的事务到达率的影响。为了清楚起见,重复了[20]中的一些结果本文的其余部分组织如下:在第二节中,讨论了相关的工作。第3节描述了嵌入式网络在数据库设计中的应用。TPC-C基准测试的性能分析在第4节中。最后,结论和未来的工作在第5节。R. Osman等人理论计算机科学电子笔记232(2009)1011032相关工作据我们所知,第一种使用嵌入式网络评估数据库系统的方法是[26]。Sevcik描述了一个通用框架,用于估计数据库系统的工作负载特性,以用作嵌入式网络模型的输入参数,该模型表示最终系统的物理硬件配置。Sevcik一般来说,数据库社区的性能评估集中在DBMS组件及其对数据库系统的影响上[32],先前讨论的研究工作是文献中描述的对数据库系统性能评估的少数研究。数据库领域性能评估的全面调查可以在[31]和[32]中找到另一方面,在性能评估学科中,大多数方法和途径都与软件系统的软件体系结构的性能评估有关[3],以物理硬件设备为模型。在性能评估领域中,一种尝试是在更详细的级别上评估数据库系统性能,这是一种使用专有系统的嵌入式网络对客户端/服务器架构进行性能评估的方法[18]。客户机/服务器系统性能的计算是通过估计事务服务需求,使用DBMS查询优化器的模型,以获得系统的底层软件架构的嵌入式网络模型的输入参数[25]也有类似的尝试在所有以前的性能评估方法中,主要目标是定义一种技术,从数据库事务和表的特性中提取性能参数。关注的是在提供这些参数的一个嵌入式网络模型,代表软件体系结构的评估系统。事务作为单个实体的性能或数据库设计对此性能的贡献,以及它们对整个系统性能的影响,都不是一个值得关注的问题,即使数据库系统的性能调优考虑到了这一点。其结果是,性能问题在硬件设备上被识别出来,从而为数据库设计者提供了一个问题所在的一般指示,例如,瓶颈在E202上,因此检查访问E202的所有事务:然而,该信息对数据库设计者没有帮助。此外,即使在早期设计阶段已有足够资料进行性能评估,但在所有设计决定已在数据库设计过程的上层确定后,性能评估仍作为整体系统设计过程的最后阶段进行。因此,在硬件设备上识别的瓶颈通过反向过程解决,即通过回溯到早期软件和数据库设计工件来识别性能问题的原因,重新设计,然后重新评估性能模型104R. Osman等人理论计算机科学电子笔记232(2009)101再次这导致反馈延迟,使性能评估方法复杂化,并影响其准确应用。此外,它质疑这些方法在工业环境中的适用性。3用于数据库设计的数据库系统的性能通常用查询和事务响应时间来衡量在数据库系统出现性能问题后,部署后性能调优的主要任务集中在修改数据库的设计和对数据库运行的事务上[16,24,27,36]。因此,如果在系统实现和部署之前就发现了数据库设计的缺陷,就可以避免一些部署后的性能问题。数据库设计工件是性能问题的主要贡献者;因此,对它们的性能的早期评估加上应用程序设计的知识是减少部署后数据库调优的主要因素。使用查询网络来评估数据库设计的性能的概念是建立在这样的前提下的,即数据库设计者能够通过使用数据库查询优化技术,基于其执行成本来在数据库开发的设计阶段,查询优化技术被用作设计高效查询和事务的指导方针数据库设计人员可以在设计时独立地调整这些技术以优化给定的SQL语句,但是当考虑查询对其他事务的性能的既然如此,趋势是等到数据库系统部署,当并发的效果和不同事务的交互将更清晰,以优化有问题的查询和更新的性能[8,24]。通过使用嵌入式网络来模拟数据库设计的动态行为,数据库设计者可以在数据库系统的物理部署之前评估设计的动态行为。现在,考虑一个包含表和访问这些表的事务的数据库设计。一个有效的假设是:事务的总响应时间=卢恩i=1 (等待访问表i的总时间+访问表i数据的总时间+从表i)向客户端返回数据的总时间+在客户端上处理过程语句其中表1,2,.,n是事务访问的表。但是:R. Osman等人理论计算机科学电子笔记232(2009)101105• 等待访问表的总时间=等待其他事务完成对表的访问的总时间;这可以被认为是等待时间;• 访问数据的总时间=将数据取入主存的磁盘访问(I/O DB页)总数×一次磁盘访问的持续时间+完成对数据的操作的总时间,可以认为是服务需求;• 将数据返回到客户端的总时间取决于客户端和服务器之间的数据振荡速率;• 处理过程语句的总时间取决于客户端的处理速度。因此,表和事务之间的关系可以表示为一个排队系统,并使用排队网络进行建模在嵌入式网络中,表将代表共享资源,即服务器,而使用这些资源的事务是客户。将数据返回到客户端和处理过程语句的总时间可以为每个事务聚合为客户端思考时间,或者作为延迟资源添加到延迟网络中数据库设计的性能建模是可能的,因为可以从事务设计的过程结构估计对其相关表的事务服务需求通过使用数据库查询优化技术[8,16,24],从SQL语句、过程语句和表之间的结构和关系。磁盘I/O成本是查询执行成本中的主导因素[8,11],特别是对于大型数据库;这是用于计算我们的网络模型的相关表上的事务的服务需求其他绩效评估投入,例如,事务的频率和计数、事务调用的数量、用户数量等都是可用的,或者可以从应用程序设计中计算出来[29]。在我们的方法中,我们将自己限制在商业DBMS中的数据库设计者可用的查询优化技术,参见[24],[16]或[8]。3.1构建网络接下来描述为数据库设计构建嵌入式网络模型的步骤。输入数据库设计包括:• 表格:• 结构、数据类型、属性选择性等。• 预期的行数和记录长度。• 索引类型和结构。• 交易:• 发生率或占总事务的百分比。106R. Osman等人理论计算机科学电子笔记232(2009)101• 结构形式:• SQL语句:• 访问的表• 连接/保留属性:序列、选择性。• 访问路径:可以在I/O DB页面中计算。• 程序性陈述。述的方法1. 指定服务器参数:• 服务器:数据库设计中的每个表都是网络中的一台服务器;分区表或复制表表示为单独的服务器。• 客户类:每个交易类型被视为不同的客户类:访问具有相同服务需求的相同表的交易类型可以被视为一个类。• 遵守纪律是FCFS:• DBMS使用队列来控制对数据对象的访问;根据等待访问或正在访问数据对象的当前事务的状态,新事务被赋予对数据对象的访问权。根据DBMS实现的并发控制机制,访问要么被立即授予新事务,要么被强制等待在当前事务之后[24]。FCFS在强制所有事务等待时对此进行了• 假定嵌入网络模型表示整个数据库,则仍在嵌入网络内的事务类似于仍在访问数据库的事务,即尚未提交或中止。在这种情况下,当事务A完成表X的服务并进入表Y时,进入表X的任何事务实际上都是与事务A并行地访问表X。因此,FCFS在事务语句级别(即在最低粒度的访问:本例中为行级别)提供串行访问,但该模型在事务级别提供并行访问。• 此外,分布式系统架构的嵌入式网络模型将每个数据库节点表示为FCFS队列[19]。• 队列长度是无限的:这是基于这样的假设,即由于死锁而导致的中止在DBMS中是罕见的[24],并且系统过载导致长响应时间而不是事务中止。2. 指定客户类别的性能特征• 每台服务器上的事务服务需求:执行SQL语句的总成本(以I/O DB页面为单位):• 假设服务需求呈指数分布,平均值为计算的I/O DB页面成本×一次磁盘页面访问的持续时间。• 根据[19],事务访问的数据库对象的数量可以用几何分布来表示鉴于这个数字R. Osman等人理论计算机科学电子笔记232(2009)101107事务访问的I/O DB页面的数量与该事务访问的数据库对象的数量相关,则事务访问的I/O DB页面的数量由于我们使用一个I/O DB页面访问的持续时间作为成本度量,因此I/O服务时间与表上的事务访问的I/O DB页面的数量相关。因此,交易的服务时间可以近似为指数分布,这是几何分布的连续版本[19]。• 开放式路由网络和封闭式路由网络的事务到达率:系统或事务思考时间的数量。3. 指定客户类的路由表;即事务访问其表的顺序。4. 求解神经网络模型。输出根据网络模型的复杂性和使用的求解方法,一些可能的输出是:• 为每个表• 瓶颈资源。• 与其他表相比的总访问量。• 平均队列长度。• 访问表的平均等待时间。• 每笔交易• 平均响应时间。• 访问每个表的平均等待时间。• 响应时间分布。构建性能模型所需的信息在早期数据库设计阶段很容易获得。如果考虑数据库设计人员在设计时可用的详细信息量,则不适合使用更详细的信息。然而,这些信息量对于我们的个人建模目的是足够的。4性能分析事务处理性能委员会(TPC)TPC-C基准测试是一个联机事务处理(OLTP)基准测试。它被写成尽可能代表实际的生产应用程序和环境。然而,TPC-C基准测试在表示实际OLTP数据库应用程序和工作负载方面存在一些缺点:基准测试108R. Osman等人理论计算机科学电子笔记232(2009)101尽管存在以前的缺点,TPC-C基准仍然是行业中OLTP系统的事实上的标准基准,也是唯一一个针对不同软件和硬件配置发布结果的数据库系统基准此外,这项工作的目的是建立使用嵌入式网络建模数据库设计的能力;因此,对于我们的目的,TPC-C基准测试的发布结果只是TPC-C基准测试数据库设计的实现。在这种情况下,我们认为TPC-C基准满足了我们的需求,其缺点可以被视为正在评估的数据库系统的特定属性或规格。TPC-C基准修订版5.8.0 [33,34]被用作数据库系统设计的示例在[9]、[10]、[14]、[15]和[5]中公开的TPC-C实现TPC-C基准是订单输入系统的设计规范。其具体内容包括[33]:• 9个表格(仓库、地区、客户、历史、订单、新订单、订单线、库存、项目);• 5个交易(新订单,付款,订单状态,交货,库存水平)。交易的简要说明见表1。表的设计细节、它们之间的关系以及交易功能的细节可以在[33]中找到。表1TPC-C基准交易摘要。反应描述最小百分比的事务总数最小平均值思考时间分布(秒)Min键控时间(秒)新秩序启动新订单。没有最低1218支付更新客户并负责对各地区及仓库的货款销售情况进行统计。43123订单状态查询客户最后一个订单的状态4102递送处理一批10个新的订单,每个地区一个给定的仓库。452股级统计某地区最近20个订单中低于库存阈值的项目数。452TPC-C基准还包括与数据库系统实现相关的性能规范,例如[33]:• 在计量期内对交易组合的监管(见表1);• 数据库初始加载大小:表2显示了用于[20]中评估的嵌入网络模型的数据库的初始加载大小;• 初始数据库加载值的随机性和概率;• 对数据库进行操作的概率和为事务选择参数值的概率;R. Osman等人理论计算机科学电子笔记232(2009)101109表2TPC-C封装网络模型的初始加载大小。表名基数(in行)典型行长度(in字节)第1页(in行)仓库1508924区15009522客户4,500,0006554历史4,500,0004645秩序4,500,0002486新订单1,350,0008256在线订购45,000,0005438股票15,000,0003067项目100,00082251DB页面大小假定为2048字节。假设DB页面已完全加载。• 所需的性能结果。不同事务的平均键控和思考时间见表1。考虑到基准测试是在模拟真实的用户环境,它指出在事务完成执行并将结果返回给用户之后,用户在选择新事务并键入其参数(事务i+1的键入时间)之前处理该数据(考虑事务i的表3SQL操作的I/O成本模型。表类型平等搜索范围搜索插入更新/删除堆0.5BDBD2D搜索+ D排序Dlog2 BD(log2 B +匹配页数)搜索+ BD搜索+ BD分类树索引DlogF 1.5BD(logF 1.5B+匹配次数页)搜索+ D搜索+ D群集散列索引1.2D1.2D ×(范围内的哈希键数)搜索+ D搜索+ D非聚集树索引D(1+logF 0.15B)D(logF 0.15B+匹配次数记录)D(3+)logF 0.15B)搜索+ 2D非群集散列索引2DBD4D搜索+ 2D乙:表示忽略头部信息的表中的数据页面的数量,即页面完全加载,D:读取或写入DB页面的平均时间,F:树索引扇出,这里我们使用了[ 24 ]中的假设:F=100110R. Osman等人理论计算机科学电子笔记232(2009)101表4用于库存级交易评估的索引。表名索引类型区哈希索引在线订购分类树索引股票分类树索引Fig. 1. TPC-C库存级事务及其优化查询树。4.1TPC-C封装网络模型使用[33]中TPC-C基准的事务描述以及[9],[10],[14],[15]和[5]中描述的执行顺序,索引结构和SQL语句在[9]、[10]、[14]、[15]和[5]中实现的TPC-C基准的股票级别交易将用作示例。查询优化技术使用查询树作为关系代数表达式的替代表示,关系代数表达式是SQL查询的转换。因此,DBMS查询成本优化器基于最有效的方法构建查询树来表示SQL查询,以评估查询并进而实现关系运算符。效率在DB I/O页面中测量[8,16,24]。因此,优化的查询树为SQL查询提供了最佳的访问计划,R. Osman等人理论计算机科学电子笔记232(2009)101111访问表的最有效顺序以及检索数据所需的I/O DB页面数。为了完成对表的服务需求的计算,表的物理结构,即聚类、分区等。等,指数类型用于使用[24]中描述的成本模型的公式计算最终服务需求,该公式总结在表3中。应用查询优化技术来估计查询DB页面成本的细节可以在[8,16,24]中找到,成本模型的细节在[24]中图1显示了Stock-Level事务及其优化的查询树,以及每个关系代数操作的计算成本(DB页面)。假设DBMS查询优化器使用左深查询树[24]来决定事务的执行计划,Stock- Level事务的表访问顺序将是DISTRICT,然后是ORDER-LINE,最后是STOCK(见附录中的假设1(d))。图1显示了为Stock-Level事务检索每个表上的数据所需的DBI/O页面数。使用实现[9]、[10]、[14]、[15]和[5]中描述的Stock-Level事务访问的表的最佳索引结构,并结合表3中描述的成本模型,计算Stock-Level事务的每个表上的总DB I/O页面成本(请参见表5)。应用上述步骤,计算其他交易的服务需求,给出表5。随后,应用第3节中描述的步骤,我们得到了图2的多类分类网络。TPC-C基准指定事务思考时间遵循指数分布,我们假设表上事务的服务需求是指数分布的,平均值如表5所示。表5TPC-C基准测试的服务需求。交易服务需求(DB页面)2我IIIIIIVVVIVIIVIIIIX新秩序1.22.21.202.22.27.37.34支付2.22.212.76200000订单状态0015.5103.4504.6300递送007.3013.219.715.400股级01.2000010.63200.760I =仓库,II=地区,III=客户,IV=历史,V=订单,VI=新订单,VII=订单线,VIII=库存,IX=项目图2是一个多类嵌入式网络,使用模拟求解。该网络由9个服务器(表)、5个类(transac-2这些值乘以一个磁盘页面访问的持续时间,以给出模拟中使用的最终服务需求。112R. Osman等人理论计算机科学电子笔记232(2009)101图二. 用于TPC-C基准测试的多类路由网络模型。使用QNAP2,一个离散事件模拟器,用于网络[22],在95%的置信区间。模拟参数总结见表6。我们已经在[20]中示出,TPC-C基准数据库设计的嵌入式网络模型表现出与[9]、[10]、[14]、[15]和[5]中的实现使用数据库设计的细节、事务DB I/O页面成本和附录中详细描述的假设,而不考虑TPC-C基准公开的实现的详细程度,嵌入式网络模型能够捕获数据库事务的预期行为这证明了模型表示数据库系统的能力。在下一节中,我们将展示数据库设计人员如何应用路由网络模型第4.2节中的工作取自[20]。表6模拟参数。仿真参数值模拟器QNAP 2模拟时间三万九千秒思考时间分布指数键控时间分布恒定DB页面I/O访问时间0.00002秒置信区间百分之九十五R. Osman等人理论计算机科学电子笔记232(2009)1011134.2业绩计量TPC-C基准测试网络的模拟分别针对10、100、500、1000和1500个客户端运行,以说明模型在不同负载条件下的行为。TPC-C事务组合如表1所示。图3-图6和图7显示了TPC-C排队网络模型的表(服务器)的平均队列长度和平均排队时间图8显示了每个TPC-C事务的每个表上的平均等待时间的关系如图3这适用于图6这种结果是任何数据库系统的典型结果:事务负载影响性能。使用这些图,我们将演示数据库设计人员如何从数据库设计中推断性能指标。图三. 不同客户端数量的TPC-C事务吞吐量的模拟结果。见图4。不同客户端数量的TPC-C事务的平均响应时间的模拟结果。140000012000001000000800000600000400000200000010100500客户数量10001500新订单付款单状态交货库存级别0.0060.0050.0040.0030.0020.001010100500客户数量10001500新订单付款单状态交货库存级别交易数量平均响应时间(秒)114R. Osman等人理论计算机科学电子笔记232(2009)101图五、不同数量客户端的TPC-C事务的平均等待时间的模拟结果从图4和图5中可以看出,尽管Stock-Level事务的吞吐量较低(图3),仅为总吞吐量的4%(这已纳入TPC-C基准规范),但Stock-Level事务的平均响应时间和平均等待时间最长。这表明该事务是性能调优的候选者,即重新设计见图6。TPC-C排队网络中不同客户端数量的平均队列长度的模拟结果。此外,从图6和图7可以看出,STOCK表具有最长的平均队列长度和最长的平均排 队 时 间 , 尽 管 STOCK 表 只 被 两 个 事 务 ( 新 订 单 和 库 存 水 平 ) 访 问 , 而CUSTOMER表被四个事务(新订单、付款、订单状态、交货)访问。此外,从图8中可以看出,0.000120.00010.000080.000060.000040.00002010100500客户数量10001500新订单付款单状态交货库存级别0.0160.0140.0120.0100.0080.0060.0040.0020.00010100500客户数量10001500仓库新订单区在线订购客户历史秩序股票项目平均加热时间(秒)平均队长R. Osman等人理论计算机科学电子笔记232(2009)101115图第七章TPC-C表针对不同客户端数量的平均排队时间的模拟结果新订单和库存水平事务所花费的金额将在STOCK表中列出。考虑到TPC-C基准将New-Order事务指定为系统性能的度量[33],STOCK表是New-Order事务和Stock-Level事务的主要瓶颈。由于TPC-C规范,新订单和库存水平事务从STOCK表中检索的数据不能更改,即这些事务不能重新设计,因此它们的服务需求不能更改。因此,重新设计STOCK表或其访问方法(索引)将有利于Stock-Level和New-Order事务的响应时间。这一结论与TPC-C实现一致,TPC-C实现将STOCK表保留在DBMS缓冲器中[9],[10],[14],[15]和[5],因此消除了I/O磁盘访问,从而减少了事务响应时间。使用这个简单的嵌入式网络模型,我们已经能够进行TPC-C基准数据库设计的瓶颈分析,并提供预期的数据库系统的性能指标。由于在我们的模拟中客户端的数量有限,并且由于实际数据对于TPC-C公开的实现不可用的事实,该结果给出了对嵌入式网络对数据库设计的适用性及其表示数据库系统性能行为的能力的令人鼓舞的指示。在下一节中,我们将使用一个更实际的工作负载来研究这对TPC-C数据库设计的性能评估的影响。4.3抵达人数激增与TPC-C工作负载模型相比,生产工作负载已经被证明是突发的[12]。我们将展示突发到达如何影响数据库设计以及数据库设计者必须考虑0.000090.000080.000070.000060.000050.000040.000030.000020.000010.0000010100500客户数量10001500仓库新订单区在线订购客户历史秩序股票项目平均加热时间(秒)116R. Osman等人理论计算机科学电子笔记232(2009)101见图8。模拟结果显示了不同数量客户端的TPC-C事务表上的平均等待时间之间的关系。以确保数据库系统按照其要求执行。为了对突发到达进行建模,使用威布尔分布来对事务思考时间进行建模。放宽了对每个事务具有恒定的密钥时间和迫使客户端在发出新事务之前等待结果的约束,从而给出了一个开放的加密网络模型。我们还在相同的放松约束下模拟了仅具有指数思考时间的模型。表7显示了三种不同模拟的参数以及本节其余部分中使用的命名约定。思考时间遵循TPC-C基准中规定的价值观和原则。我们将上一节的模拟结果称为EXP+CST。EXP、Weibull 0.7和Weibull 0.3模型的性能指标与上一节中EXP+CST模型获得的结果相似,但Weibull 0.3模型的事务平均响应时间模式如图9所示,新订单交易的平均响应时间长于交付交易,而在EXP+CST中,交付交易的平均响应时间长于新订单交易(图9)。4)。我们关注New-Order交易,因为它是TPC-C基准的性能度量。此外,从图。图10-这与EXP+CST模型不同,在EXP+CST模型中,股票级别交易的平均交易时间最长(图10)。5)。性能测量的这种变化表明TPC-C设计对工作负载的变化敏感。 这向数据库设计人员表明,有必要进行更灵活的设计,以便在不同的工作负载条件下表现良好。R. Osman等人理论计算机科学电子笔记232(2009)101117表7EXP、Weibull 0.7和Weibull 0.3模型的模拟参数。仿真参数值模拟器QNAP 2模拟时间三万九千秒DB页面I/O访问时间0.00002秒置信区间百分之九十五型号1(EXP)思考时间分布指数模型2(威布尔0.7)思考时间分布威布尔,形状参数= 0.7,规模参数=事务思考时间模型3(威布尔0.3)思考时间分布威布尔,形状参数= 0.3,规模参数=事务思考时间图第九章Weibull 0.3模型对不同数量的客户端的平均响应时间图10. 不同客户端数量的EXP模型的事务平均等待时间对此的直接解释是,等待应答的每个客户端的突发到达和约束的放松已经引起了拥塞网络中的拥塞,因此性能已经降低,参见表8因此,数据库设计人员的问题是这种拥塞在哪里表现出来,以及如何考虑这方面重新设计数据库。现在,让我们看看每个事务在每个0.0060.0050.0040.0030.0020.001010100500客户数量10001500新订单付款单状态交货库存级别0.000250.00020.000150.00010.00005010100新订单付款500客户数量订单状态10001500递送股级平均加热时间(秒)平均响应时间(秒)118R. Osman等人理论计算机科学电子笔记232(2009)101图十一岁Weibull 0.7模型在不同客户端数量下的事务平均排队时间图12个。Weibull 0.3模型在不同客户端数量下的事务平均排队时间表.我们将考虑EXP+CST、EXP、Weibull 0.7和Weibull 0.3模型的新订单和库存水平交易的结果,其中包含1500个客户。从图13中可以看出,New-Order事务花费了大部分时间来搜索STOCK表。然而,随着到达速率变得更加突发,主要的排队时间百分比正从STOCK表稳定地转移到CUS-TOMER表。这对于其余的事务(未示出)也是如此。从图14中可以看出,Stock-Level事务的等待时间也在慢慢地从STOCK表转移。随着突发性级别的增加,其他事务对New-Order事务的影响更加明显,系统的新因此,数据库设计人员必须重新设计CUSTOMER表,以实现更高效的访问,从而适应工作负载条件的变化。5今后的工作在本文中,一种新的建模技术,以评估性能的数据库设计使用嵌入式网络进行了演示。这一应用程序,0.00030.000250.00020.000150.00010.00005010100500客户数量10001500新订单付款单状态交货库存级别0.00180.00160.00140.00120.0010.00080.00060.00040.0002010100500客户数量订单状态10001500新订单付款递送股级平均加热时间(秒)平均加热时间(秒)R. Osman等人理论计算机科学电子笔记232(2009)101119表8EXP+CST、EXP、Weibull 0.7和Weibull 0.3模型的TPC-C交易的性能指标。交易EXP+CSTEXP威布尔0.7威布尔0.3吞吐量(交易数量)新秩序125464523202411834506262852支付119691122153611750643249127订单状态11186820669416335023253递送11156820643916311123541股票11130020606816286023178平均响应时间(秒)新秩序0.0001766890.0002906190.0003326290.001709支付0.000151620.000142410.0001518340.000603订单状态0.0001784620.00016860.0001718940.000341递送0.000514280.00054680.000565210.001081股票0.0041563860.004176580.004163890.00487平均解冻时间(秒)新秩序0.000090850.0002048690.0002468850.001611支付0.000045070.000035880.0000451780.000489订单状态0.0000154760.000007120.000009280.000171递送0.000019690.00005150.000068360.000565股票0.0001136070.0001260120.0001306010.000831表9EXP+CST、EXP、Weibull 0.7和Weibull 0.3模型的TPC-C表的性能指标。表EXP+CSTEXP威布尔0.7威布尔0.3平均队长仓库0.000326600.000444000.000387600.00033110区0.000471100.000669000.000628400.00048960客户0.004778000.010800000.009620000.00736600历史0.000075020.000140000.000110500.00002160秩序0.000455200.000820000.000648300.00011820新订单0.000768700.001440000.001138000.00019560在线订购0.001824000.003310000.002648000.00046690股票0.015160000.033000000.027290000.01005000项目0.000318700.000593000.000470400.00008179平均解冻时间(秒)仓库0.000003280.000001930.000002320.00002260区0.000004290.000002610.000003660.00003188客户0.000017990.000033400.000044210.00046002历史0.000000010.000000020.000000020.00000005秩序0.000000910.000000700.000000660.00000245新订单0.000001630.000001700.000001710.00000438在线订购0.000003480.000002500.000003050.00000970股票0.000079200.000155000.000179700.00101590项目0.000000130.000000150.000000140.00000047将网络应用于数据库设计增加了数据库设计的动态建模元素,使数据库设计人员在实施之前更清楚地了解设计的预期性能,从而改进数据库设计并减少昂贵的部署后数据库调整。我们已经表明,我们的数据库设计性能模型有能力评估预期的数据库系统性能的数据库设计和针点数据库设计工件的性能重新设计。这一点已经确立,120R. Osman等人理论计算机科学电子笔记232(2009)101图13岁1500个客户端的新订单事务处理的平均等待时间百分比通过模拟TPC-C基准测试设计,演示数据库设计人员如何从TPC-C基准测试的嵌入式网络模型中推导出性能指标。此外,还演示了突发工作负载对TPC-C数据库设计的预期性能的为了更准确地验证模型,将使用TPC-C基准的实现来参数化我们的存储网络模型,特别是对DBMS存储子系统的缓冲器命中率和响应时间的估计。这将使我们能够获得绝对的结果,从网络模型和验证其假设。锁定和锁定延迟,即使是数据库系统性能瓶颈的主要贡献者[16,24,27],目前也不会在细化模型中考虑,因为可以实现TPC-C基准实现以最小化不同事务之间以及同一事务的实例之间的锁争用[9],[10],[14],[15]和[5]。此外,我们还对TPC-C基准数据库设计进行了建模,使用带锁的网络模型,但对该模型的模拟没有产生任何锁定事务或锁定冲突。此外,需要解决嵌入式网络和我们的建模技术对其他类型的数据库设计的适用性作为最后一步,锁定和锁定连接将被纳入模型。
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- RTL8188FU-Linux-v5.7.4.2-36687.20200602.tar(20765).gz
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
- SPC统计方法基础知识.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功