没有合适的资源?快使用搜索试试~ 我知道了~
博士学位论文L’UNIVERSITÉ DE RENNES和科尔 第601章第一次见面数学与信息与通信科学与技术通过丹尼尔·罗德里格斯·卡瓦略在内存层次结构2021年4月9日在视频会议上提交并答辩论文研究单位:InriaRennes -PACAP论文编号:答辩前的报告员:Daniel ETIEMBLE南巴黎大学教授BernardGOOSSENS佩皮尼昂大学教授评审团组成:主席:姓名姓名姓名(答辩后注明)检查员:亚瑟·佩赖斯TIMA格勒诺布尔卡罗琳·科兰吉Inria Rennes奥利维尔·森蒂耶斯雷恩第一Dir.论文:安德烈·塞兹内克Inria Rennes3C座桥中的T座法文摘要130.1内存层次结构130.2存储器的压缩130.3区域块压缩160.4对等空间共享181导言211.1回忆211.2缓存221.2.1更换政策231.3处理层次结构241.4改善记忆251.5论文结构272了解压缩缓存292.1动机292.2处理数据302.2.1输入粒度302.2.2精确度312.2.3覆盖数据312.3映射压缩数据322.3.1多对一映射322.3.2多对多映射342.3.3减少标签开销342.3.4查找段362.3.5专用缓存372.3.6其他设计382.4压缩可用性392.4.1自适应压缩392.4.2避免频繁减压402.5交互和摘要412.5.1与索引策略的414内容表2.5.2与更换政策的。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...422.5.3与预取的。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...432.5.4与安全性的。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...432.5.5总结。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...443压缩记忆473.1存储器压缩。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...473.1.1映射。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...483.1.2操作系统支持。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...493.1.3基于DRAM的提案。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...503.2链路压缩。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...553.3内存层次结构压缩。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...584压缩算法614.1基于字典的压缩。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...614.1.1添加模式。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...634.1.2添加符号。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...654.1.3调整词典大小。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...664.1.4多个词典。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...674.1.5共享词典。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...684.2其他技术。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...714.3多压缩机。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...7254.4延迟交易。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...724.5总结。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...735高效处理压缩块755.1对等空间共享。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...775.1.1块放置。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...775.1.2尺寸表示。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...785.2方法论。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...805.2.1结果。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...815.2.2单个尺寸对的。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...835.2.3使用配对进行比较。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...836粒度探索856.1分而治之。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...866.1.1将区域块应用于最先进的压缩器。... ... ... ... ... ... ... ... ...896.2区域块压缩器的... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...906.2.1通用化Base-Delta压缩机。... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...92内容表56.2.2优化Base-Delta压缩机936.2.3从解析类型95中分离基大小6.3Stride压缩机966.4选择子压缩机966.5结果976.5.1基本增量优化976.5.2Rx Cw压缩机986.5.3单循环减压996.5.4压缩机总面积1007结论1037.1未来工作1057.2最后发言106参考书目107出版物列表129内容表78在克罗尼姆斯BAI带宽感知索引。41BCR最佳压缩比97.BDI基地-三角洲-立即。16、44、67、71、72、74、86、89、92、95、99、100、102、105、100BPFCBurtscher的PFC。57、58BLEM混合元数据引擎54BP块对。18、19、78BPC位平面压缩71、74、99、105C-Pack高速缓存打包程序。16、66、67、72基于电缆盒的链路编码器。57、58CAM内容可寻址存储器。70CAMP压缩感知管理策略。四十二CC压缩缓存。45CF压缩系数。78五十四Coco跨对象压缩。74COPR压缩预测单元54个CPU中央处理单元。二十一、五十八DBI数据总线反转。58DPB-Delta-BitPlane。71DCC解耦合压缩缓存。三十七、四十五DFPC动态频繁模式压缩。74DICE动态索引缓存压缩。38、45DISH词典共享。72、74、94动态RAM。4、21、22、38、47、48、50、56、81DSF决策切换过滤器。40DVSC解耦合变量段缓存。34、45首字母缩略词9零压缩DXC耦合。51、56、59ECC纠错码。58ECM有效缓存最大化器。四十二FCMS细粒度压缩存储器系统。45RPC频繁模式压缩。66、67、74、99FPC-D:具有有限字典支持的频繁模式压缩。16、67、68、73、74、86、96、97、99、105FVC频繁值缓存。三十八GB千兆字节。48GPU图形处理单元。48、58HoPE热缓存预测和早期解压缩。四十二HyComp混合压缩。72I/O输入/输出。二十一IIC间接索引缓存。三十四IIC-C带压缩的间接索引缓存。40、45、59每个周期的IPC说明22、83、97、99KB千字节。 50、52、60LBE大块编码。68、70、74LCP线性压缩页。51、52、56LLC 最 高 级 别 缓 存 。 22 , 39 ,59LLP线路位置预测器。55最少使用的LU42、81LSB最低有效位17、19、31、38、55、57、78、85、87、88、91、93、105、107、108、109、100LUT查找表。56、57LZLempel-Ziv. 74MB兆字节。22、23、48、52MBZip-CMBZip在缓存中五十二MBZip-M内存中的MBZip。52、5310首字母缩略词MORC面向多核的压缩缓存。38、45MPKI每千指令丢失数。二十二、八十MRU最近使用。四十二ESB最重要位。17、19、35、38、57、66、78、85、87、88、91、93、94、105、99、MSHR缺失状态保持寄存器。81MXT内存扩展技术。50、56、59非易失性存储器。48O2W机会主义双向。45OOO无序。81操作系统。4、26、47、49、52PBC分阶段二进制代码。64PBC预取块压缩。43PCM相变存储器。48PSS对等空间共享。76PTMC实用且透明的内存压缩。54和56RAM随机存取存储器。二十一RRIP参考区间预测。42、81SB超级块。34、35、39、42、45、52、54、55、78、79、82SC2 统计压缩缓存。45SCC倾斜压缩缓存。32、39、42、45、80SCMS选择性压缩存储器系统。32、45、50、56Spec标准性能评估公司。18、65、76、80、86、92SRAM静态RAM。22用于重用和压缩的SRC协同缓存布局。四十二STT部门转换表。50SWC显著性-宽度压缩。55、58标签和数据。三十八TBTB TB。22TLB-Translation备用缓冲区47、51、52、81首字母缩略词11X-RLX-Match和运行长度。74、99XID独占ID。五十四YACC又是一个压缩缓存。32、39、42、45、78零内容。51、5913R总结 在FRancais0.1内存的层次结构运行工作负载时,计算机必须将其当前计算存储在称为内存的存储器中。不幸的是,因此,添加具有成比例的延迟和能量成本的逐渐较小的存储器层次结构[ NW15 ]也称为高速尽管高速缓存和缓存利用这一点在这种常见情况下提供更快的访问更大的高速缓存大小可以此外,然而,高速缓存也意味着节能,因为没有高速缓存将意味着对片外存储器的更多访问,而片外存储器的功耗要高出1000倍[NW 15];因此,IT架构师的目标是开发更大但节能的高速0.2内存的压缩多年来,有几项研究提出了提高记忆力的方法这包括14法文摘要高速缓存[AP93,PHM15]、减少标签区域要求这项工作的重点是通过压缩来提高内存的技术存储器压缩可以具有多个目的,但是但是,此升级在传统的高速缓存中,数据阵列中的物理条目(数据条目)的大小通常是高速另一方面,在压缩高速缓存中,可以将多行分配给单个数据条目[LHK00]。 这有效地增加了缓存的大小,而几乎没有增加表面积:不是增加数据输入的数量,而是添加压缩器、解压缩器和一些电路来处理压缩块的组织。因此,压缩器的复杂性成为一个关键的权衡-压缩算法通常会生成更大、更复杂的硬件,因为可以获得更好的压缩因子[PSM+ 12]。此外,随着越来越多的数据如果标签条目的数量遇到的另一个问题是,由于解压缩延迟严重影响存储器延迟,因此必须将其保持在最小值[AA18]。因此,虽然理论上可以在所有级别应用缓存压缩,但压缩最靠近核心的缓存可能很困难;因为它们是最常用的缓存,因此向此关键路径添加解压缩延迟可能会此外,当数据被压缩时,找到关键字并不是微不足道的;因此,解压缩必须在幸运的是,有一些技术可以用来减少数据解压缩的平均等待时间每当压缩的输入被覆盖时,可能会发生数据溢出,即新的压缩大小可能会这S’il restesuffisamment d’espace dans la tranche de données, les données sont mises à jour, aussi bienque法文摘要15移动和排出步骤可以在此外,必须读取和分析来自共同分配条目的原生元,以计算必须执行的操作当应用于主存储器时,压缩进一步扩展了一系列挑战:虽然在高速缓存中,行是使用标签来定位的,但是对于较大的存储器来说,这些标签的体积变得难以忍受;因此,通常主存储器不包含这些结构。这使得定位压缩行变得困难此外,操作系统由于操作系统可见的内存量大于物理内存量,因此它无法知道物理内存何时耗尽;因此,尽管它可能认为仍有内存可供使用,但实际上可能已经最后,我们还可以设计一个系统,其中整个存储器层次结构被压缩。在这样的系统中,具有多种压缩方法(例如,一个用于高速缓存层次结构,另一个用于主内存),尽管这是一个有吸引力的决定--人们可以为更靠近核心的高速缓存选择更快的方案,为更远的内存选择高效的方案--但它可能不是最佳的。这是因为存储器级别之间的转换需要不断的解压缩和压缩;但是,如果所有级别都使用相同的压缩器,则可以发送压缩数据以节省带宽。因此,决定是否对所有级别使用单一压缩方案非常重要。尽管如此,与传统内存层次结构[ HR05、LHK00]相比,完全压缩的内存层次结构可以显著提高性能、功耗具有更高的有效容量意味着更少系统的整体性能得到提高。此外,尽管此外,由于发送压缩数据的事实,即,传输时间可以减少。在相同的时间间隔内可以发送更多的数据[CR95,STBD14]。最后,压缩整个系统的优点法文摘要16内存延迟;因此,具有高延迟的系统由于减少了对更高内存级别的访问而获得更好的性能0.3区域块压缩硬件压缩算法通常是用于数据压缩的算法的简化导出。C’est le cas pour deux raisons:premièrement, la complexité matérielle doit rester limitée; deuxièmement, la latencesupplémentaire inhérente, ajoutée高速缓存压缩往往严重依赖于数据的空间和时间位置;本质上,期望先前看到的值完全或部分重复。因此,基于字典的压缩器占主导地位,这些压缩器使用行中的第一个值然后,这些引用用于删除后续值中的重复位(重复数据删除)[KGJ96、CYD+ 10、AA18]。重复数据删除通常假定重复为了解决这个问题,压缩器可以添加模式,如果基础假设是较小的数据类型,这些模式将是可见的例如,匹配除32位值的最低有效位之外的所有八位字节的模型为了捕获16位数据类型的类似行为,同时仍然假设工作负载包含32位数据类型,可以添加MXMX模型这意味着,为了能够压缩所有基本数据类型,压缩器必须提供覆盖匹配/不匹配字节的所有可能排列的模型,这是昂贵的随着此外,具有更多的模型提高例如,BDI[PSM+ 12]可以在1个循环中执行减压,而仅覆盖两个模型。然而,它的平均压缩比(压缩和未压缩大小之间的比率)很C-Pack[CYD+ 10]和FPC-D[AA 18]等提案增加了更多型号法文摘要17并达到较低的比率;然而,它们的解压缩可以慢到通常,已经观察到值的较强权重部分(SSB)的内容比其较弱对应部分(LSR)的内容具有更少的可变性;因此压缩器倾向于更好地因此,将块进一步划分为不同的部分可能是有利的,这些部分被不同地压缩。块大小(块)(1),因此引用先前条目的概率字典e是更大的stt 此外,EtNT因为每个部分总是被期望表示块的相同的相应位,所以本文介绍了区域块(RC)压缩,这是一个新的视角来解决匹配问题。区域块压缩是一个概念,它允许更好地隔离匹配的内容,并RC不是以值粒度压缩缓存行,而是将每个值分成更小但大小相同的子值,这些子值这有助于添加子划分的主要优点此外,由于每个地区的压缩机模型的组合产生了更广泛的范围,因此所涵盖的模型数量也隐含地例如,对于64位块,MMMMMXMM模式通常不是所选模式的一部分;但是,它将作为包含MM和MX模式(MM+ MM+ MX+ MM)的R16 C64压缩器中的四个区域的可能组合而被确保粒度细化的另一个优点是可以修改每个区域的压缩机以满足其需求。例如,期望定制这些压缩机的另一种方法是修改模型本身-例如。通过增加或减少不匹配位的数量,可以分别增加条目重复数据删除的可能性或减小压缩数据的大小虽然这些优点可以直接通过模型压缩机来利用法文摘要18总的来说,模型覆盖范围的增加对于将基本增量压缩机[ PSM + 12 ]的效率提高到最新水平是非常有利的;因此,引入了几种新的压缩机,其扩展和改进了基本增量压缩机,以实现良好的压缩比和更高的效率。延迟减压护送。这些新的压缩器涵盖了广泛的数据类型,可快速解压缩并提高0.4成对空间共享一旦一行被压缩,压缩方案就决定将它放置在 一些压缩技术将压缩限制为固定大小(例如,行大小的25%和50%),向小于这些大小的行添加填充[SSW14,SSW16]。这些受约束的方法需要少量的元数据,但限制了共同分配的机会。此外,虽然高速缓存压缩器可能在计算的某些部分取得成功,但仍有大量数据无法达到与压缩兼容的压缩大小;对于几个最先进的压缩器,2017年SPEC [Cor 17]上的平均压缩大小仍然远远超过未压缩大小的50%,这使得在这种限制下难以有效地共同分配块D’autrespropositions suppriment ces limites, permettant aux blocs d’être compressés à n’importequelle taille [虽然这些方法允许压缩此外,在缓存中定位行变得非常重要:它们可以在数据数组中的任何位置找到。这这会导致为了利用不受约束的大小的优势,但以其硬件成本的一小部分并且没有延迟惩罚,引入了对等空间共享(PSS)。PSS是一种部分约束的压缩技术,它需要最小的元数据量,但仍然提供等效的结果。对于PSS,块被共同分配为块对(BP),使得该对的压缩大小之和必须适合此外,与以前的方法不同,PSS隐式存储元数据并降低数据扩展的可能性使用PSS简化了数据输入中的块放置。而非约束表示使用指针或周围子块的大小
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- C++多态实现机制详解:虚函数与早期绑定
- Java多线程与异常处理详解
- 校园导游系统:无向图实现最短路径探索
- SQL2005彻底删除指南:避免重装失败
- GTD时间管理法:提升效率与组织生活的关键
- Python进制转换全攻略:从10进制到16进制
- 商丘物流业区位优势探究:发展战略与机遇
- C语言实训:简单计算器程序设计
- Oracle SQL命令大全:用户管理、权限操作与查询
- Struts2配置详解与示例
- C#编程规范与最佳实践
- C语言面试常见问题解析
- 超声波测距技术详解:电路与程序设计
- 反激开关电源设计:UC3844与TL431优化稳压
- Cisco路由器配置全攻略
- SQLServer 2005 CTE递归教程:创建员工层级结构
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功