提升分布式动态可重构多核处理器性能的技术研究

版权申诉
0 下载量 63 浏览量 更新于2024-07-02 收藏 14.75MB PDF 举报
“分布式动态可重构多核处理器上的取指停顿容忍技术” 在现代计算机体系结构中,分布式动态可重构多核处理器(Distributed Dynamic Reconfigurable Chip Multiprocessor, DDRCMP)作为一种创新设计,旨在提升串行程序的性能。DDRCMP结构允许物理核心动态重组形成逻辑处理器,以适应不同任务的需求,特别是在处理单线程或串行任务时。然而,这种架构面临的一个主要挑战是取指停顿,这通常由内存访问异常和分支预测错误导致的流水线刷新所引起。 论文主要关注两种常见的误预测事件:访存违例和分支误预测。针对这些问题,研究者提出了一种分布式回放协议和分布式控制无关技术,以减少误预测对系统性能的影响。 1) 分布式回放协议:该协议专注于数据推测恢复机制。当发生访存违例时,传统的处理方式会清空流水线,而分布式回放协议提供了一个轻量级的指令回放机制,使处理器无需清空流水线即可从数据误预测中恢复。在DDRCMP处理器TFlex上应用此协议后,处理器可以在内存读取指令时采取更激进的策略,不必担心访存违例会降低性能,从而最大化串行任务的性能潜力,并增强TFlex的性能可扩展性。实验证明,加入分布式回放协议后,16个物理核组成的TFlex逻辑处理器性能达到理想性能的99%。 2) 分布式控制无关技术:该技术旨在处理分支预测错误。通过保存误预测分支指令后面的有用指令和计算结果,可以减少流水线的冲刷范围和次数。结合分布式回放协议,TFlex能快速识别并重新执行受影响的指令,确保程序的正确执行。实验结果显示,引入分布式控制无关技术后,在16核TFlex上运行的多个串行程序性能平均提升了35%。 这两种技术的结合显著提高了DDRCMP的性能,尤其是在处理串行程序时,降低了由于误预测导致的性能损失,增强了处理器的性能可扩展性。关键词包括:分布式动态可重构多核处理器、访存违例、分支误预测、回放协议、控制无关以及性能可扩展性。这些研究成果对于优化基于多核处理器的系统设计具有重要意义。