没有合适的资源?快使用搜索试试~ 我知道了~
基于概要引导的代码优化
基于使用概要引导度量的源到源转换的代码优化引用此版本:尤恩·莱布拉斯基于使用配置文件引导的度量的源到源转换的代码优化。自动控制工程巴黎萨克雷大学(COmUE),2019年。英语NNT:2019SACLV037。电话:02443231HAL Id:tel-02443231https://theses.hal.science/tel-024432312020年1月17日提交HAL是一个多学科的开放获取档案馆,用于存放和传播科学研究文件,无论它们是否已这些文件可能来自法国或国外的教学和研究机构,或来自公共或私人研究中心。L’archive ouverte pluridisciplinaireS基于使用简档引导的度量的源到源转换的代码优化巴黎萨克雷大学博士学位论文Ecole doctorale n19580 Sciences et technologies de通信(STIC)博士学位:“Programmation:modèles,algorithmes,langages,建筑学”Thèse présentée et soutenue à Versailles,le 3 Jullet 2019,par尤恩莱布拉斯评审团组成:安东尼·斯切马马法国国家科学研究中心、人类发展研究所、图卢兹大学特别报告员Angelo Steffenel)McF HdR,香槟-阿登兰斯大学特别报告员Michel MasellaCEA DRF,HdR,Saclay检查员丹尼斯·巴尔图PR.波尔多大学校长Sophie RobertMcF,UniversitéPR,Université de Versailles Saint-Quentin Directeur de thèse Andres S.沙里夫鲁比亚尔博士,PeXL共同参与者罗曼·多尔博博士ATOS BENG Invité编号:iii作者声明我 , Youenn LEBRAS , 声 明 这 篇 题 为 “Code optimization based on source-to-sourcetransformations using profile guided metrics”的论文以及其中的工作是我自己的。本人确认:这项工作全部或主要是在候选人在这所大学的研究学位。如果本论文的任何部分以前曾在本大学或任何其他机构提交学位或任何其他资格,这已明确说明。• 在我查阅他人已发表的著作时,这一点总是明确的。在我引用别人的作品时,总是给出出处。除了这些引文外,这篇论文完全是我自己的作品。• 我已经确认了所有主要的帮助来源如果论文是基于我与他人共同完成的工作,我已经明确指出了他人所做的工作和我自己的贡献。签名:Youenn LEBRAS日期:2019年3月7日····vUVSQ摘要Paris-SaclayUVSQ -Li-ParadPhD. 计算机科学专业学生基于源代码到源代码转换的代码优化,使用由Youenn Lebras现代高性能处理器架构通过严重依赖增加的向量长度和高级内存层次结构来解决性能问题,当必须管理多个架构相关的转换时,生产HPC代码的手动优化成为一项困难的任务。开发人员通常相信编译器会自动解决这些性能问题,但他们部署的静态性能模型和算法必须保持保守,甚至在最坏的情况下失败。可以通过使用来自动态分析的反馈数据来细化更复杂的优化选择。但是,它并不总是考虑一些指标,并且很少在指标数据收集方面具有足够的积极性另一方面,性能分析工具在检测特定的性能问题方面非常出色,但只能返回关于代码质量和执行的观察结果我们的目标是开发一个框架,允许执行基于性能分析工具指标的源代码转换 该 框 架 将 被 纳 入 MAQAO 工 具 套 件 。 我 们 提 出 了 一 个 FDO 工 具 与 一 组 源 到 源transformations的指导下的指标来自各种MAQAO工具和开放给用户的建议。这个框架还可以用来简化开发,自动执行一些简单但耗时且容易出错的转换(例如,循环/函数专门化)。vii确认在你选择之前,我想向M表示感谢。威廉·杰尔比,为了让我在实验室工作,为了让我在那里工作我也想请安德雷斯·S。沙里夫-鲁比亚尔为了他的安全。我了解我的报告员安东尼·斯切马马和安杰洛·斯特凡内尔,希望他们能耐心地工作,并让我能够为我的工作和工作做一些回顾这些年来,我并没有完全恢复,但对实验室的成员来说,这些都是生活中最容易的 塞德里克,为了给我们的MPR带来勇气,而不是让我们一直心跳,为了在评论之前为晚会绘图,为了比赛付费。以马内利,我们要在这段时间里讨论我们的任务。雨果,我的法国布列塔尼人,我们在蒙包隆谈吧 贾斯珀给你介绍放松的方法。马蒂厄,为了让我有耐心(是的,耐心),我看到了办公室,也帮助我解决了键盘和键盘之间的各种问题(这是因为你的笔记或笔记),因为你的引用总是很有启发性,你的幽默也是黑色的谢谢你!我非常感谢实验室的其他成员,因为我已经过了很多时间,但是我已经完全适应了工作凯文,我们的舞台上有一个很好的记录;巴勃罗帮助我在游行和上课时进行了大量的练习;约翰,医生和教练,Nathalie和Sylvain,如果我没有参加比赛,就不会有同样的事情,克莱门特,玛丽,克里斯蒂安,为了不同的讨论和时刻,他们没有错过这些年的比赛感谢我的父母和我的兄弟,为了他们的支持和耐心,他们可能会理解我对这件事的看法,以及为什么会坚持我的工作非常感谢Chloé的工作人员,特别是她一直在照顾我(也很长时间),因为她可能会在这段时间内生病。我希望你能多留点时间给我带点好东西。为了这一切我决定了。viii还有一位非常感谢的工作人员,他是我的朋友,他的名字是:Romain和MP,Julien,Jaunathan,Gaetan和Pierre(为工作后的孩子们服务),Xavier,Jeremy,Zac,Anthony,Cassandre等。我还得写多少页才能让全世界的人都相信我的话,但您可以一直用您的名字写在适合的空白部分谢谢!最后,在所有这些感谢之后,我想感谢你随机公民!是的,你,谁会读这篇论文(或至少是一个简短的部分)。感谢您认为这份手稿中有一些有趣的东西。ix内容作者声明III摘要v鸣谢.七1背景11.1HPC处理器架构的演变。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的11.1.1单核设计细节。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的21.1.2内存技术- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的51.2伟大的进化带来巨大的困难。 . . . . . . . . . . . . . - 是的-是的81.2.1矢量化演进。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的81.2.2内存组织101.3第12章1.3.1导言. 121.3.2限制131.4性能分析工具141.4.1静态分析141.4.2动态分析16使用采样16使用跟踪181.4.3全局视图使用两个191.5优化工具技术211.5.1最佳化技术21.........................................................................................................1.5.2旗帜研究221.5.3轮廓引导优化(PGO)221.5.4图书馆231.5.5指令241.5.6领域特定语言241.5.7源到源251.5.8自动调谐26x1.6结论。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的262协助292.1背景。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的292.1.1规范/上下文。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的292.1.2用于源到源转换的现有工具。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的30鲸鱼座- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的30第4段所有PIPS。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的31OpenC++。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的31DMS软件重新设计工具包。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的31LLVM(Clang Flang)。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的32斯科特。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的32奥里奥- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的32玫瑰- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的32摘要- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的332.1.3马考。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的342.2设计&实施。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的362.2.1概述。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是36xi的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的2.2.2辅助原则。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的382.2.3融入澳门。- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的382.2.4与用户的互动- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的392.3显式支持的转换。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的392.3.1展开。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的402.3.2完全展开。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的402.3.3瓷砖。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的412.3.4露天矿- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的422.3.5互换。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的422.3.6循环计数转换(LCT)。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的432.3.7短向量转换(SVT)。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的442.3.8预取器。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的462.3.9恒定传播。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的472.3.10本地死代码消除。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的472.3.11专业化。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的48循环.- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的48功能- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的492.4评估转换验证。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是51xii的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的它是如何工作的。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的51对比一下。- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的52xiii用例示例54限制.542.5结论3是什么触发了变革,以及如何触发变革573.1一、导言. 573.2收集的数据和触发的转换573.2.1P57型坦克3.2.2AutoFDO593.3协助转换到触发器603.3.1循环计数613.3.2完全展开卷613.3.362号立交桥3.3.4瓷砖露天矿3.3.5预取器623.3.6专业化633.3.7短矢量化653.4结论664实验694.1应用程序池704.2价值分析的影响714.3专业化的影响734.3.1仅专业化754.3.2与SVT76组合4.3.3与瓷砖结合844.4Prefetchers的影响864.4.1使用Mini QMCPAK864.4.2AVBP904.4.3耶鲁2904.5内部预取函数924.5.1数字食谱924.5.2关于QMCPACK944.6其他共同变革4.6.1关于QMCPACK954.7结论.97xiv5问题限制99&5.1结论1036结论1056.1捐款1056.2观点106A附录:ASSIST111A.1 帮助111A.2 ASSIST比较器配置文件113A.3 用于比较器的114A.4 安装要求115A.5 如何使用116A.5.1带注释的源文件116A.5.2结果116A.5.3转换脚本116A.6 转换脚本117A.7 ASSIST API118A.8 为ASSIST118生成的OneView报告示例A.9 注意事项限制119A.9.1预处理器119A.9.2语言119B 附录:代码121B.1预取器121B.2英特尔优化指令/规则123C 附录:其他结果125C.1 预取器125参考书目129xv图目录1.1DDR1允许在时钟信号的上升沿和下降沿传输数据。来源https://en.wikipedia.org/wiki/Double_data_rate。 . - 是的-是的71.2通过使用高带宽内存的图形卡切割的子部分。灰点表示:PCI express /电流/显示器连接器。资料来源:https://en.wikipedia.org/wiki/High_Bandwidth_Memory。. . . 71.3顺序加法和向量4元加法运算之间的执行差异。资料来源:https://www.slideshare。net/IntelStware/the-next-leap-in-javascript-performance.. . . 91.4两种可能的英特尔Optane用例。来源:Intel(R)-Optane(TM)-Technology-Workshop-Analyst-and-Press-Slides-322.pdf..............................................122.1执行源到源的现有工具摘要。................................................................................................ 342.2一个用MAQAO进行剖析的过程概述。......................................................................352.3工具使用概述 用户决定必须执行哪些静态和动态分析。转换脚本是一个Lua脚本,用户指定要应用的转换,避免直接修改源代码。或者,用户可以让ASSIST直接使用配置文件来执行转变..................................................................................................................................372.4使用ABINIT进行转换前后的比较示例,测试用例Ti-256 ..............................................................................................................533.1AutoFDO调用图检测热路径正确的函数调用。........................................................ 603.2Polaris-在应用SVT65之前的全局度量3.3北极星-在应用SVT之前,先将两个热点的全局和循环。 663.4Polaris -应用SVT后的全局指标。................................................................................673.5北极星-两个热点的全局指标和特定指标循环后,SVT已被应用。..............................................................................................................67xvi4.1直方图:ASSIST LCT、IPGO以及两者的组合与两个数据集Yales2的相同线程数的原始版本相比的影响(加速)(越高越好)。 误差条表示原始版本除以最小加速比和原始版本除以最大加速比。Plots:MPI中花费的执行时间百分比。..................................................................... 724.2在Yales2上使用3D CYLINDER测试用例和AVBP上使用ASSIST处理的循环数的累积加速比,按其覆盖率排序NASA测试案例..............................................................................................................744.3卷积神经网络-与原始版本相比,特殊化后GoogleNet_V1层的加速。..................754.4在使用SIMPLE测试用例(顺序版本)的AVBP上,与原始版本(越高越好)相比,在使用ASSIST(SVT,函数/循环专门化,LCT)和IGO进行转换之前和之后,按函数进行加速。..................................................................................................774.5直方图:ASSIST SVT的加速(即 短向量化+函数/循环专门化),ASSISTLCT,IPGO和ASSIST LCT+IPGO与原始版本相比,使用NASA,TPF和SIMPLE测试用例在AVBP上使用相同数量的线程(越高越好)。误差条表示原始版本除以最小加速比和原始版本除以最大加速比加速AVBP。Plots:MPI中花费的执行时间百分比................................................. 794.6函数“gather_o_cpy”的循环嵌套814.7原始版本:函数“gather_o_cpy”的执行时间详细信息,它的循环的所有变体。..................................................................................................814.8函数专门化版本:函数“gather_o_cpy”及其循环的执行时间详细信息。..............824.9循环专门化版本:函数“gather_o_cpy”及其循环的执行时间详细信息。..............834.10 ABINIT --结合循环平铺的函数专门化示例,使用ASSIST执行,用于用例Ti-256。方框突出显示最里面的循环的平铺变换。..................................................................854.11 ABINIT - Ti-256 -与原始版本86相比,IPGO、ASSIST LCT、ASSIST专用、ASSIST专用和平铺的加速4.12 MiniQMCPACK-<-n 20-g“4 2 2”>-所有配置的功能加速。所有加速比都与配置0(所有预取器打开)进行比较图表分为两部分。..........................................................................................................884.13 MiniQMCPACK--n 20-g“4 2 2”>-所有配置的循环加速所有加速比都与配置0(所有预取器打开)进行比较。图表分为两部分。............89xvii4.14 AVBP- SIMPLE:每个预取器配置的函数加速所有将加速比与配置0(所有预取器开启)进行比较图形4.15分为两部分。. - 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的Yales 2 -3D_Cylinder:每个预取器组合的功能加速 所有加速比都与配置0(所有预取器打开)进行比较。的图表分为两部分。-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的91934.16 Yales 2 - 3D_Cylinder:与为一个、两个和四个进程启用的所有预取器相比,通过预取器组合实现的加速。- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的94A.1 ASSIST的Oneview内部报告的POLARIS示例,一方面是全局指标,另一方面是循环所有指标的“oneview_report”。- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的120C.1 管理的功能的OneView视图。. - 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的126C.2 每个预取器行为的函数加速。-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的127xvii表的列表1.1发布年份、内核数量范围和频率范围,每个微架构有无Turbo Boost。资料来 源 : www.wikipedia.org ( 仅 选 择 了 服 务 器 信 息 ) ,https://en.wikipedia.org/transsistor_count. - 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的21.2每个处理器的晶体管数量及其面积,每1核心 来源https://en.wikipedia.org/wiki/Transistor_count。. . - 是的-是的21.3近期架构关键参数的演变 专用端口集合:AES加密、向量置换、SADBW、PCLMUL、跳转和分支,分公司资料来源:www.anandtech.com&www.agner.org/optimize/。. . . . -是的41.4双倍数据速率关键参数。 “每秒Gigattransfers是指每秒发生的传输数据的操作数”。周期时间表示两个时钟周期之间的时间,单位为纳秒。来源:https://en.wikipedia.org/wiki/DDR_SDRAMhttps://www.memoireonline.com/01/12/5117/m_volution-sur-la-memoire-vive7.html,https://en.wikipedia.org/wiki/Double_data_rate&https://www.transcend-info.com/Support/FAQ-296. - 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的61.5Intel Vector指令集的演变。-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的91.6存储器层次结构关键参数L3延迟随内核数量而波动,L3切片越多,延迟越大。缓存TLB是“page size:# entries,associativity”资料来源:https://www.anandtech.com和https://en.wikichip.org..........................................................................................................112.1用于数据预取 的四种硬件预取器。 来源:https://software.intel.com. - 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的-是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的- 是的464.1ASSIST LCT为每个应用程序和测试用例处理的循环数。 714.2在&应用SVT之前,使用SIMPLE数据集,AVBP热点函数循环的CQA VPROF度量。..................................................................................................................................784.3ASSIST SVT的执行时间和加速比(即 通用短矢量化)与使用“test_1.0.5.18”
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功