GPU加速：If-Conversion算法优化 Predicated Execution 控制依赖

需积分: 7 83 浏览量更新于2024-09-09 1 收藏 79KB DOCX 举报

"On Predicated Execution" 是一种针对GPU（图形处理器）设计的优化技术，主要目的是提高并行处理效率，因为GPU的SIMD（Single Instruction Multiple Data）架构允许同时执行多个操作，但并非所有数据块都需要立即执行。该方法利用预测寄存器（Predicated Register，PRF）来控制程序的基本块（BasicBlock），通过If-Conversion算法消除不必要的跳转指令，从而将控制依赖转换为数据依赖，简化指令调度。核心原理是为每个基本块分配一个PRF，如论文中的p=R(x)函数，其中x代表某个基本块，p是相应的PRF。决定PRF分配的关键在于如何确保每个PRF仅控制与其关联的基本块，例如，BB2使用PRF p2。论文还讨论了如何在基本块内部使用PRF，通过K(p)={BB1,BB3}这样的定义来表明p2在BB1和BB3中生效。控制依赖（Control Dependence）是算法设计的基础，它描述了一个基本块Y是否受另一个基本块X的影响，即X决定了Y是否执行。如果存在一条路径，除了X和Y外，路径上的所有节点都被Y完全包含（即post-dominated），且X不被Y包含，那么Y依赖于X。控制依赖算法CD(t)与论文中的策略密切相关，它帮助确定了何时何地定义PRF，即K(p)的实现。论文中的RK函数指出，如果两个基本块x和y有相同的控制依赖集CD(x)=CD(y)，则它们在执行上可以被视为等效，即可以共享相同的PRF资源。这种方法优化了指令流，减少了分支指令，使得GPU能更有效地并行处理，从而提升整体性能。总结来说，On Predicated Execution是通过If-Conversion算法利用控制依赖的概念，有效地管理和优化GPU的执行流程，减少分支指令，提高并行计算的效率。通过合理分配和使用预测寄存器，这一策略有助于提升GPU应用程序的性能和资源利用率。

On Predicated Execution

目的：由于 GPU 属于 SIMD 架构，也就是单指令多数据，当一堆数据

过来时，不一定同时跳转，因此这里通过预测寄存器来控制，也就是

通过 If-Conversion 算法消除所有的跳转指令，这样带来的好处就

是，将控制依赖转换为数据依赖，同时增大了 Basic Block 的大小，

为有利于后面的指令调度。

这个算法其实很简单，我们可以这么理解：

1) 每个 Basic Block 都要有一个 PRF 去控制当前的 Block 是否被

执行，这里的控制，我们可以理解为，每个 Block 需要 Use 一个

PRF 去控制当前 Block(假定 BB2 用 P2 去控制，那么 BB2 的所有

的指令都会用 P2 去 guard)。

2) 既然需要一个 PRF，那么这个 PRF 应该在哪里 define 比较好呢？

对 1)来说就是考虑为每个 Block 分配哪个 PRF 去控制 Block，也就

是论文中的 p = R(x)算法，这里的 x 指某一个 Block,p 指某一个

PRF,比如上面提到的 R(BB2) = p2;

对 2)来说就是考虑每个 Block 中用的 PRF 应该在哪里去定义呢，也

就是论文中的 K(p) = {BB, BB…},还是上面的那个例子，假定 p2

在 BB1 和 BB3 中定义，那么 K(p) = {BB1, BB3};

简单介绍了上面的算法后，首先要了解一个概念，即控制依赖，

control dependency.我们需要明白的是，关于控制依赖的算法已

经存在了，并不是在这里发明的，我们看看控制依赖的定义：

A node (basic block) Y is control-dependent on

another X iff

X determines whether Y executes, i.e.

• there exists a path from X to Y s.t. every node

in the path

other than X & Y is post-dominated by Y

• X is not post-dominated by Y

//参考 ControlDependence.pdf

从上面的定义我们看到，其实在论文中讲到的算 CD(t)就是来自于控

制依赖的定义而已。控制依赖就解决了在哪定义的问题，也就是上面

说到的 K 算法。

我们下面说说论文中的几个结论：

RK function:

1) x≈y if CD(x)=CD(y)

//如果 Block x 和 y，都同时控制依赖一个集合，那么 x≈y,约

下载后可阅读完整内容，剩余3页未读，立即下载

xiaoquan9653

粉丝: 21
资源: 5

GPU加速：If-Conversion算法优化 Predicated Execution 控制依赖

重叠流水和向量流水处理机计算机软件及应用it计算机专业资料PPT课件.pptx

5605-5171-1-PB_TheBat_APSO_economicdispatch_PSOBATALGORITHM_bata

(完整数据)ESG数据大全（论文复刻、彭博、华证、商道融绿、富时罗素等）2022年

资产导入器和查看器旨在以 VR 帧速率对裸体人物进行照片般逼真的渲染 .zip

【路径规划】模拟退火算法结合LNS求解车辆路径规划问题【含Matlab仿真 2333期】.zip

web大作业HTML网页设计源代码code

【路径规划】人工电场算法栅格地图机器人最短路径规划【含Matlab仿真 2861期】.zip

基于Python 3.9.13 + Django 2.2.16 实现的运维 devops 管理系统资料齐全+详细文档.zip

毕设新项目基于卷积神经网络的图像和视频风格迁移程序源码+模型+运行安装指南.zip

【路径规划】世界杯算法栅格地图机器人路径规划【含Matlab仿真 2827期】.zip

最新资源