没有合适的资源?快使用搜索试试~ 我知道了~
通用仿真对大规模数据系统鲁棒性优化的贡献
通用仿真及其对大规模数据系统鲁棒性优化的贡献引用此版本:塞巴斯蒂安·古若。通用仿真和对大规模数据系统鲁棒性优化的贡献性能和可靠性[cs.PF]。巴黎萨克雷大学(COmUE),2017年。法语。NNT:2017SACLV011。电话:01581051HAL ID:电话:01581051https://theses.hal.science/tel-01581051提交日期:2017年HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaireNNT:2017年SACLV011T是博士学位来自大学准备好的UNIVERSITY的 VERSAILLES圣昆廷在Y静脉第580号博士学校信息和通信科学与技术博士专业:计算机科学通过M. 塞巴斯蒂安·古若通用仿真及其对优化大规模数据存储系统鲁棒性的贡献论文于2017年5月11日在凡尔赛发表并答辩评审团组成:夫人J·乔安娜· T·奥马西克评审团主席中央高级教授M.JAC qUES JORDA报告员图卢兹大学HDR IRIT高级讲师M.R. AYMOND N.AMYST报告员波尔多大学LaBRI教授M.JACQUES-CHARLES LAFOUCRIÈRE负责IS科学和CEA-DAM网络的审查员M.PPHILIPPE C打开检查器Atos数据管理研发经理M.WILLIAM JALBY博士生导师夫人。UVSQ教授SORAYA ZERTAL博士论文共同导师UVSQ高级讲师小论坛那些谁允许— 感谢Soraya Zertal,她在— 感谢威廉·贾尔比指导我的论文,感谢— 感谢Jacques-Charles Lafoucrière和Philippe Deniel,感谢他们对我的研究的信任和贡献;— 论文评审团成员,感谢他们— 感谢Antoine、Florent、Colin和Yohan,他们是我这三年来的同事;— 感谢米哈伊尔、托马斯和克里斯托弗,他们都是硕士的同学,也参与了— 感谢伯努瓦和尼古拉斯,我与研究界的第一次接触,他们— 感谢巴勃罗、托马斯和实验室的成员,感谢他们在我的日子里进行的各种讨论;— 最后,我要感谢我的妻子、母亲、家人和朋友,是他们造就了今天的我我说谢谢。关键词:仿真、大规模数据存储、鲁棒性、磁盘、闪存摘要:数据存储系统的容量正在稳步增长,目前在数据中心中已达到EB级。这一增长是由于存储阵列中使用的磁盘数量不断增加,但也是由于其容量(现在可以超过10TB)。这对存储系统的鲁棒性具有真正的影响。实际上,系统中包含的磁盘数量越多,其中一个磁盘出现故障的可能性就越同样,从故障中重建驱动器所需的时间与其容量成正比。因此,新的鲁棒性机制的开发以及以 与 性 能 度 量 相 同 的 方 式 量 化 这 种鲁 棒 性 的 重 要 性 变 得 至 关 重 要 。模拟是一种允许在接近真实的条件下测试新机制的工具。然而,文献中没有提供支持代表当前系统的存储系统的工具,即异构和大规模的存储系统L’hétérogénéitéd’un système est définie par l’utilisation d’une association de disques issues detechnologies différentes, comme par exemple pour les systèmes actuels, une开放和通用数据存储系统仿真工具(OGSSim)是OGSSim是一个并行软件,它针对给定的硬件配置和一组请求计算不同的性能指标它的模块化分解允许OGSSim中包含的开放性思想还使任何用户都可以添加自己的算法来进行测试。OGSSim的第一个验证步骤产 生 了 令 人 满 意 的 结 果 , 因 此 在 L G P L 下 提 交 了 软 件 的 第一 个 版 本 。由于鲁棒性是这些系统中的一个关键参数,我们使用去集群RAID来它包括将逻辑存储系统划分为数据块,并将它们以定义的模式放置在物理系统上。该机制的有效性直接取决于所使用的放置方案以及该方案寻求满足的约束。当前的模式可以分为两类:使用数据块的副本(数据的精确副本)的模式(如Crush方法)和不使用副本的模式我们提出了源集的对称差分(SD2S),这是一种基于满足四个约束的布局方案创建算法。我们专注于一个或多个故障后的访问并行性模式的创建基于数据块的偏移,一个条带接一个条带,以λ步长。该λ通过计算度矩阵来确定,度矩阵用于评估物理磁盘上块的逻辑来源集的接近度为了量化SD2S的有效性,我们在OGSSim中实现了SD2S,并在不同的配置中进行了测试。 通过将SD2S与无副本的Crush方法进行比较,我们表明,一方面,在正常模式和故障模式下,放置方案的创建速度更快,有利于SD2S,另一方面,如果系统没有发生故障,存储空间的成本也减少或为零。此外,在发生双重故障时,SD2S可确保备份这篇论文使我们能够开发OGSSim(我们的存储系统模拟工具)和SD2S(优化大型存储系统鲁棒性的算法)。计划对这项工作进行扩展,为OGSSim提供多节点并行性,并为SD2S优化在多个故障情况通用仿真及其对大规模数据存储系统关键词:仿真、大规模数据存储、鲁棒性、硬盘驱动器、固态驱动器摘要:数据存储系统的容量持续增长,接近数据中心的EB级。这种增长是由存储阵列中使用的磁盘数量激增以及驱动器容量(目前已超过10 TB)驱动的。这对存储系统的鲁棒性有很大的影响。实际上,系统中的磁盘数量越多,发生故障的可能性就越大。此外,磁盘故障后重建所用的时间与其容量成正比因此,开发新的稳健性机制并量化这种稳健性作为性能指标变得至关重要。模拟是在接近真实条件下测试新机制的适当技术。然而,文献并没有提供能够处理典型的现代存储系统(即异构和大规模存储系统)的工具。异构系统由不同技术的磁盘的使用定义例如,在当前系统中,硬盘驱动器(HDD)和固态驱动器(SSD)的组合是不可用的。我们提出了一个新的软件,我们称之为开放和通用数据存储系统模拟工具(OGSSim)。它处理了这些现代系统的异质性和大规模。OGSSim是一个并行软件,它针对给定的硬件配置和请求集计算不同的性能指标。它的模块化允许将每种存储技术、布局方案或计算模型都理解为可以添加和组合以优化配置模拟的砖块。OGSSim是一个开放的软件,意味着它允许任何用户添加自己的算法来进行实验。针对实时系统的OGSSim验证的第一步返回令人满意的结果,这导致我们根据LGPL许可证提交OGSSim的第一个版本鲁棒性是这些系统的关键问题因此,我们使用去集群RAID来简化和确保数据分发和磁盘在发生故障时的重建。它由两个步骤组成首先,将逻辑数据存储系统划分为块。然后,块分布在物理系统上。这一机制的有效性直接取决于所使用的安置方案,以及该方案必须遵守的限制。当前的方案可以分为两类:使用类似于粉碎方法的复制品的方案和没有复制品的方案我们提出了源集的对称度量差分(SD2S)算法来实现数据块的放置方案该布置方案基于对四个约束的遵守-磁盘和条带并行性、一次或多次故障后的系统可靠性以及负载平衡。投资计划创建与转移数据有关根据偏移量λ,逐条逐块。该λ通过计算度数矩阵来确定,度数矩阵用于估计物理磁盘块的逻辑源集之间的距离为了评估SD2S的效率,我们在OGSSim中实现了SD2S,并在不同的配置下进行了实验。SD2S与无复制品粉碎方法的比较导致两种结果。首先,SD2S加快了正常和失败模式下的投资计划创建SD2S的内存空间成本大大降低(如果没有故障,则为零)。此外,SD2S保证在多个故障的情况下进行部分(如果不是全部)数据重建本文的主要贡献是开发了OGSSim,我们的大型异构数据存储系统仿真工具,以及我们的SD2S算法,提高了大规模存储系统的鲁棒性。这些工作的扩展计划为OGSSim的多节点并行版本,并在多个故障的情况下优化SD2S目录目录IX图十三表表十五引言11数据存储:最新技术水平1磁盘技术61.1硬盘驱动器1.2基于闪存的磁盘81.3非易失性存储器接口-2永久磁盘管理122.1硬盘的持续管理2.2SSD的永久管理3存储系统的配置193.1只是一堆磁盘(JBOT)3.2独立磁盘冗余阵列(RAID)203.3合成244存储系统的模拟245结论292OGSSim:动机和概念图311动机322OGSSim 32的总体概念图2.1技术信息322.2已使用的库342.3OGSSim 37的输入输出文件3结论443 OGSSim:实施和验证451提取链1.1提取痕迹461.2建筑提取1.3事件的提取2分解链482.1治疗前482.2第49卷试点2.3驱动程序磁盘51九3计算。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...543.1执行。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...543.2可视化。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...564 OGSSim的验证... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...584.1实验环境... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...584.2针对SSD的。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...604.3针对HDD的验证。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...624.4针对真实系统的验证。 . . . . . . . . . . . . . . .635结论和展望。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...654通信和同步1ZeroMQ的。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...67682同步子查询。 . . . . . . . . . . . ...693预读处理期间的。 . . . . . . . . . ...744总线中用于调度的 . . . . . . . . ...755总线级优先级管理。 . . . . . . . . . . . . . . . . ...786... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...817研究OGSSim的运行时间... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...838结论和展望。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...865面向鲁棒性1OGSSim中故障模式的。... ... ... ... ... ... ... ... ... ... ...87881.1预处理模块的。... ... ... ... ... ... ... ... ... ...881.2卷驱动程序的。... ... ... ... ... ... ... ... ... ... ... ... ... ... ...891.3磁盘驱动程序和运行时模块的...901.4前景。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...912个解密RAID。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...912.1关于去集群RAID的学术。... ... ... ... ... ... ... ... ...942.2文件系统中的去集群RAID。... ... ... ... ...972.3解密RAID。... ... ... ... ... ... ... ... ... ... ...982.4评估。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...... ...1003符号。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...1004投资。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 1004.1约束1:磁盘之间的并行性。 . . . . . . . . . ... 1004.2约束2:条带之间的平行度。 . . . . . . . . . . ... 1014.3约束3:来源集的独立性。... ... ... 1024.4约束4:负载平衡。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 1035个简单。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...1036结 106论。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...6大规模1071 SD2S算法的... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 1092度 矩阵。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...1092.1度的定义... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 1092.2度矩阵的构造。 . . . . . . . . . . . . . ... 1103SD2S。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ......1113.1正常模式下运行。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 1123.2故障模式下的操作。... ... ... ... ... ... ... ... ... ... ... ... ... ... 1124结果。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...1144.1空间。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...1144.2时间成本1154.3重建请求的行为1174.4保存的数据1194.5资产负债表1205结论和展望121结论123捐款123展望和未来工作125参考书目127OGSSim 135输入文件说明请求分解算法139图表1.1HDD6的拓扑结构1.2HDD7的分区模型1.3SSD8的拓扑结构1.4收集面包屑的示例111.5执行碎片整理的示例1.6JBOD19的配置1.7RAID-0配置201.8RAID-1配置211.9RAID-01配置221.10 RAID-4配置221.11 小、宽和全条纹的定义231.12 RAID-5配置,带24个群集2.1OGSSim 33的一般模型2.2OGSSim34中的代码行分布3.1型号层(a)/卷(b)/设备(c)473.2OGSSim 52的磁盘驱动程序模型3.3可视化图形示例573.4针对创见的验证370613.5针对SamsungEVO 85061的验证3.6针对希捷ST50063的验证3.7根据HGSTTravelstar Z7K50063进行验证4.1ZeroMQ1-1684.2ZeroMQn-1704.3用于计算响应时间的查询之间的依赖关系724.4用于创建子查询的同步744.5用于预读取处理的同步764.6通信总线上的请求路由794.7基于系统大小的OGSSim运行时间4.8基于硬件配置的OGSSim运行时间5.1可视化图形示例(RAID 4+1)915.2已删除RAID93配置5.3图5.293系统中d P 4的故障5.4使用Mini-RAID94进行组织5.5去集群RAID示例(Shanbhag等人,2004年)。(2014年)...................... 995.6满足第一个约束条件1015.7遵守第二个约束条件1025.8遵守第三个约束................................................................................................条件103十三5.9遵守第四个约束条件1046.1安置方案示例1106.2左移位置示例(λ=2)1126.3施工图创建的模拟时间1166.4重建方案创建的模拟时间1176.5创建原理图的模拟时间和系统的大小1186.6重建请求响应时间1186.7重建请求的分布119表的图片1.1NAND单元上的操作执行时间1.2NOR和NAND单元的擦除次数1.3SSD18的永久管理算法综述1.425种配置的合成2.1OGSSim40中可用的请求格式3.1预处理模块重定向表示例493.2用于验证OGSSim 58的磁盘规格3.3测试集的参数604.1传送单元的可能类型4.2运行OGSSim 81时生成的线程数4.3可用于通信通道的端口824.4OGSSim 84运行时研究的配置5.1每种配置类型所采用的行为895.2数据重建过程中生成的查询和操作。905.3SD2S 101算法的符号表5.4朴素算法106的模式创建结果6.1图6.1系统的度矩阵1116.2SD2S和Crush115方法的空间成本6.3系统参数的数量级1156.4图6.5的实验设置5OGSSim 135配置文件中的标签列表6OGSSim 136配置文件的属性列表7体系结构配置文件的标签列表1368体系结构配置文件的属性列表1379磁盘描述文件中的标签列表138十五简介背景如今,数据存储无疑已成为每个用户都关心的问题无论是用于移动使用,与智能手机,SD卡,U盘或更传统的方式与磁盘,那些基于闪存。此外,在过去两年中,存储市场的两个领导者HGST和三星分别推出了容量为10 TB(HGST,2015)和16 TB(Samsung,2016a)的HDD和SSD型号希捷宣布即将推出大规模存储系统(即数据中心)有两种方法— l’augmentation— l’augmentation du nombre de disques composant le当今的数据中心具有大的物理区域,允许 例如,全球最大的两个数据中心,SwitchSUPERNAP园区(美国)和Range International Group数据中心(中国)于2016年完工,占地面积分别为600,000平方米和585,000平方米(Reno Luxury Homes,2015 ; Ligato,2016)。数据中心规模的增长带来了几个问题,包括财务成本、由于使用磁盘和冷却系统而产生的能源成本事实上,对于后者,每个驱动器都有一定的发生故障的可能性,并且该驱动器数量的增加增加了数据丢失的可能性。 此外,由于重建磁盘所需的时间与其大小成正比,因此磁盘容量的增加对重建机制的持续时间有直接影响。这两个观察结果导致的结论是,如果没有通过硬件和/或软件机制来增强鲁棒性,数据存储系统越来越容易发生故障。1
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- C++多态实现机制详解:虚函数与早期绑定
- Java多线程与异常处理详解
- 校园导游系统:无向图实现最短路径探索
- SQL2005彻底删除指南:避免重装失败
- GTD时间管理法:提升效率与组织生活的关键
- Python进制转换全攻略:从10进制到16进制
- 商丘物流业区位优势探究:发展战略与机遇
- C语言实训:简单计算器程序设计
- Oracle SQL命令大全:用户管理、权限操作与查询
- Struts2配置详解与示例
- C#编程规范与最佳实践
- C语言面试常见问题解析
- 超声波测距技术详解:电路与程序设计
- 反激开关电源设计:UC3844与TL431优化稳压
- Cisco路由器配置全攻略
- SQLServer 2005 CTE递归教程:创建员工层级结构
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功