动态分支预测实验：比较与分析

需积分: 0 46 浏览量更新于2024-06-30 收藏 2.08MB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

"该实验是关于动态分支预测的，使用SimpleScalar工具的sim-bpred仿真器在Linux环境下进行。实验目的是理解动态分支预测技术，并对比不同预测器类型的性能。实验涉及的操作系统包括Microsoft Windows 10和Ubuntu x64，使用了VMware Workstation 12 Pro作为虚拟机。实验要求在5种分支预测方法（bimod，two-level adaptive，always taken，always not taken，comb）下运行tests/bin.little目录中的test-math, test-fmath, test-printf三个测试程序，并针对前两种预测方法调整参数进行对比分析。" 动态分支预测是现代计算机体系结构中提高处理器性能的关键技术之一。它通过预测程序执行路径来减少因分支指令引起的延迟，从而提升处理器的吞吐量。在本实验中，学生们将深入理解这一概念。 1. **bimod** 分支预测：这是一种简单的预测策略，它使用一个双状态的位来预测分支，通常分为“总是取”和“不总是取”。如果分支连续多次朝同一方向，预测器将更新位的状态，以增加预测正确的概率。 2. **two-level adaptive** 分支预测：这种更复杂的预测器使用两个级别的历史信息，适应性地调整预测。第一级用于短期历史，第二级用于长期历史，以提高预测准确性。 3. **always taken** 和 **always not taken**：这两种预测器总是假设分支会或不会被取，分别适用于分支几乎总是取或不取的情况。 4. **comb** 分支预测：结合了多种预测策略，以期望通过混合方法提高预测的准确性。实验中，学生需要对每种预测方法运行指定的测试程序，并且对于two-level adaptive预测器，使用不同的参数配置（例如，不同级别的大小和历史长度）进行实验。通过分析输出的统计参数，如预测正确率、误预测率、分支吞吐量等，可以评估每种预测器的性能。在实验过程中，学生需要记录每个测试程序在不同预测器下的表现，并据此写出分析报告。这有助于他们理解不同预测技术如何影响处理器性能，以及在特定情况下哪种预测方法更为合适。通过实践，学生不仅能掌握理论知识，还能获得实际操作经验，增强问题解决和分析能力。

资源详情

资源推荐

benchmark 的执行参数可参照每个目录下的 runme_small.sh，注意文件扩展名要设为.sh），

分别采用五种不同的分支预测方法，即 bimod 方式，two‐level adaptive 方式，always taken

方式，always not taken 方式，comb 方式，并对前两种分别使用下表中两种参数配置；分

析仿真器输出的关于分支预测的统计参数集，填写表格，并对各仿真器的能力给出相应说

明。

注：为了方便，可在命令后追加重定向语句（> 【文件名】），以将程序的输出重定

向至一文件。

各 benchmark 的执行文件及需要的参数：

Basicmath：

basicmath_small Bitcount：

bitcnts 75000 Qsort：

qsort_small input_small.dat Susan：

susan input_small.pgm output_small.smoothing.pgm ‐s

susan input_small.pgm output_small.edges.pgm ‐e

susan input_small.pgm output_small.corners.pgm ‐c

四、实验原理

SimpleScalar 分支预测的实现方法：先进行分支方向探测，即是否采取分支（当然跳

转指令和调用返回指令不用作这一步），接着是生成分支地址，对于调返指令，直接在 RAS

上作相关操作，普通分支指令则要利用 BTB 来进行地址探测，命中则生成地址。然后对两

步综合，地址命中且分支预测为采取，返回分支目标地址；地址不命中且分支预测为采取，

返回 1;只要分支预测为不采取，就返回 0。重点分析针对条件分支指令的方向探测方法，

主要有 6 种，三种静态：taken,not tanken,perfect;三种动态：bimod,2‐level,comb。静态的

方法顾名思义，只是 perfect 这种，按它的原薏是不预测，直接把真正采取的下一条指令

填入 npc，而且它确实不需要调用 pred‐lookup 函数，但据有人说，这种方法有时性能不

如 bimod，另外在 sim‐bpred 中好象也没加入这种方法，只是在 sim‐outorder 中有实现。

对于三种动态方法，分别说明如下：

bimod 是普通的，即采用一个 2bit 宽的分支方向预测表，按分支地址查找，2bit 分支

预测器的判断和更新与课本上的一致。这种方式只有一个参数，就是分支预测表的长度。

2-level 要复杂一些，它采用两级表格式，第一级是分支历史表，存放各组分支历史寄存

器的值，第二级是全局/局部分支模式表，（全局或局部应是由表长相对于分支历史寄存器

的长决定），它存放各分支历史模式的 2bit 预测器。在判断时用当前分支指令对应的历史

寄存器值去索引二级表得到相应预测器值。更新时，把当前分支的方向左移入历史寄存器，

并对使用过的 2bit 预测器作更新。它有四个参数，前三个是一级表长度，二级表长度，历

史寄存器宽度，后一个是异或标志。如果为 1，则将历史寄存器的值与当前分支指令地址异

或，用其结果再去索引二级模式表。

剩余18页未读，继续阅读

李诗旸

粉丝: 31
资源: 328

动态分支预测实验：比较与分析

分支预测器实验。。。。

Lab4-分支预测-实验指导1

实验报告：动态分区分配方式的模拟

嵌入式处理器动态分支预测机制研究与设计.pdf

华中科技大学 MIPS_CPU 实现了动态分支预测与FPGA上板 计算机组成原理课程设计 cpu实验--流水 logisim电路图 .zip

Lab4: 动态分支预测(BTB与BHT)实验指南与性能优化

SMT处理器上动态分支预测器设计与性能分析

动态分支预测控制提升大滞后磨矿分级系统效率

ARMv9中的分支预测与动态分支预测优化

基于大滞后磨矿分级系统的动态分支预测转移控制技术 (2010年)

同时多线程处理器上的动态分支预测器设计方案研究*) (2006年)

lab4-分支预测1

奔腾家族处理器的分支预测

分支预测器的代码以及文献

面向对称密码协处理器的轻量级分支预测技术研究.pdf

分支预测与解释器性能：打破迷思

SimpleScalar模拟器学习：从分支预测到Cache性能分析

优化处理器结构：分支预测与BTB在矩阵乘法中的应用

最新资源

华中科技大学 MIPS_CPU 实现了动态分支预测与FPGA上板计算机组成原理课程设计 cpu实验--流水 logisim电路图 .zip