提升分布式动态可重构多核处理器性能的技术研究
版权申诉
63 浏览量
更新于2024-07-02
收藏 14.75MB PDF 举报
“分布式动态可重构多核处理器上的取指停顿容忍技术”
在现代计算机体系结构中,分布式动态可重构多核处理器(Distributed Dynamic Reconfigurable Chip Multiprocessor, DDRCMP)作为一种创新设计,旨在提升串行程序的性能。DDRCMP结构允许物理核心动态重组形成逻辑处理器,以适应不同任务的需求,特别是在处理单线程或串行任务时。然而,这种架构面临的一个主要挑战是取指停顿,这通常由内存访问异常和分支预测错误导致的流水线刷新所引起。
论文主要关注两种常见的误预测事件:访存违例和分支误预测。针对这些问题,研究者提出了一种分布式回放协议和分布式控制无关技术,以减少误预测对系统性能的影响。
1) 分布式回放协议:该协议专注于数据推测恢复机制。当发生访存违例时,传统的处理方式会清空流水线,而分布式回放协议提供了一个轻量级的指令回放机制,使处理器无需清空流水线即可从数据误预测中恢复。在DDRCMP处理器TFlex上应用此协议后,处理器可以在内存读取指令时采取更激进的策略,不必担心访存违例会降低性能,从而最大化串行任务的性能潜力,并增强TFlex的性能可扩展性。实验证明,加入分布式回放协议后,16个物理核组成的TFlex逻辑处理器性能达到理想性能的99%。
2) 分布式控制无关技术:该技术旨在处理分支预测错误。通过保存误预测分支指令后面的有用指令和计算结果,可以减少流水线的冲刷范围和次数。结合分布式回放协议,TFlex能快速识别并重新执行受影响的指令,确保程序的正确执行。实验结果显示,引入分布式控制无关技术后,在16核TFlex上运行的多个串行程序性能平均提升了35%。
这两种技术的结合显著提高了DDRCMP的性能,尤其是在处理串行程序时,降低了由于误预测导致的性能损失,增强了处理器的性能可扩展性。关键词包括:分布式动态可重构多核处理器、访存违例、分支误预测、回放协议、控制无关以及性能可扩展性。这些研究成果对于优化基于多核处理器的系统设计具有重要意义。
2021-09-25 上传
2021-09-25 上传
2023-05-28 上传
2023-03-29 上传
2024-01-10 上传
2024-01-28 上传
2023-11-10 上传
2024-06-27 上传
2023-11-14 上传
programmh
- 粉丝: 4
- 资源: 2162
最新资源
- Hadoop生态系统与MapReduce详解
- MDS系列三相整流桥模块技术规格与特性
- MFC编程:指针与句柄获取全面解析
- LM06:多模4G高速数据模块,支持GSM至TD-LTE
- 使用Gradle与Nexus构建私有仓库
- JAVA编程规范指南:命名规则与文件样式
- EMC VNX5500 存储系统日常维护指南
- 大数据驱动的互联网用户体验深度管理策略
- 改进型Booth算法:32位浮点阵列乘法器的高速设计与算法比较
- H3CNE网络认证重点知识整理
- Linux环境下MongoDB的详细安装教程
- 压缩文法的等价变换与多余规则删除
- BRMS入门指南:JBOSS安装与基础操作详解
- Win7环境下Android开发环境配置全攻略
- SHT10 C语言程序与LCD1602显示实例及精度校准
- 反垃圾邮件技术:现状与前景