APU性能评估：光线跟踪中的计算性能对比

7 浏览量更新于2024-06-18 收藏 1.09MB PDF 举报

"APU性能评估：加速计算量大的工作负载" 本文主要探讨了APU（Accelerated Processing Unit）在处理计算密集型工作负载时的性能表现。APU是一种结合了CPU（中央处理单元）和GPU（图形处理单元）的集成处理器，常用于低成本的个人计算机系统。研究中，作者通过光线追踪算法这一典型的计算密集型任务，对比了APU与同价位的CPU和GPU解决方案的性能差异。光线追踪算法在计算机图形学中用于模拟光的传播路径，以生成逼真的图像。由于其高度并行和计算密集的特性，传统的CPU在执行此类任务时效率低下。而GPU，由于其设计初衷就是解决图像生成中的并行计算问题，通常在渲染和图形处理方面表现出色。在评估过程中，作者指出，虽然CPU在处理通用任务和某些特定加速功能上有所改进，如视频处理和硬件加速，但面对大数据集和大量计算任务时，其性能瓶颈依然明显。相比之下，GPU的并行架构使其在处理光线追踪等计算密集型任务时速度更快。 APU的出现旨在提供一个平衡点，它结合了CPU的通用处理能力和GPU的并行计算能力。研究结果显示，对于特定类型的工作负载，APU可能提供比单独的CPU或GPU更经济有效的解决方案，尤其是在需要同时进行计算和图形处理的场景下。此外，文章还强调了随着技术的发展，计算机系统的集成度、性能和多功能性持续提升，APU作为其中的一个实例，展示了未来计算机硬件设计的一种趋势。通过将不同功能的处理单元集成到单一芯片上，可以实现更高效的能效比和成本效益。 APU在处理计算量大的工作负载时展现出了一定的优势，特别是在那些需要高效并行计算的应用领域。然而，其性能是否超过独立的CPU或GPU，取决于具体的应用场景和工作负载类型。这项研究为选择合适的处理器提供了有价值的参考，对于开发者和系统设计师来说，理解APU的性能特征对于优化计算密集型应用至关重要。

106

E. Rivera-Alvarado

，

F.J. Torres-Rojas / Electron. Notes Theor. Comput. Sci. 349

（

2020

）

103-

对于光线跟踪，它不像典型的CPU那样在指令获取和指令解码周期另一方面，这个

解决方案只是一个功能有限的原型。此外，它是在FPGA上开发的，因为在出版时

在硅上实现设计的

使用

GPU

作为光线跟踪的默认平台的主要原因之一是

RAM-VRAM

事务频繁，与

CPU相比，GPU具有较小的缓存，因此内存事务需要更多的带宽[27][15]。考虑到

这一点，最近的举措特别关注通过

GPU

加速光线跟踪中的光线

对象相交

[36]

。他们

提出了一种机制来压缩发送到

GPU

内存的预处理对象的数据结构，这降低了

RAM

和

VRAM之间所需的通信带宽。这种方法的缺点是增加了每个GPU VRAM事务的数据

压缩时间。不过，这种方法只适用于需要大量内存事务的场景。

使用预处理数据结构作为加速机制的另一种方法是边界体层次（BVH）。该方

法分析场景中的每个元素，并将它们添加到边界框中，这些边界框将逐步添加到更

大的容器中，从而创建一个二叉树数据结构。通过这种方式，当光线没有穿过边界

框时，子树和容器中的所有对象都将被丢弃，从而节省了大量的处理时间[27]。通

过这种加速机制可以获得高性能增益，因为它避免了多个射线

对象交叉点的不必要

计算[33]。该算法最初设想在CPU中运行，后来由[6]移植到GPU，然而，尚未找到

APU的具体实现

有一些开发旨在将

GPU

定位为通用计算平台

[31][10]

，或者找到一种优化的方式

来调度GPU（甚至不是APU中的集成GPU）[34]。两者都是研究领域和我们的研

究不同。

设计

我们专注于展示APU作为可行的架构，以提高计算密集型工作负载的性能，特别是

光线跟踪。这是相关的，因为

APU

广泛可用，并存在于许多商品硬件中

[14][20]

。

我们不仅仅是在寻找一个算法从CPU到GPU的移植，也不是对现有算法的优化。为

APU设计了一种新颖的光线跟踪算法，该算法深入了解了如何使用该架构的特定特

性来提高计算密集型工作负载的性能。例如，我们在很大程度上依赖于在集成的

GPU和CPU之间以高效的方式共享数据结构的能力，因为内存由两个处理器共享，

这避免了PCI-Express总线的通信瓶颈。内存量可以扩展到与操作系统可用的内存

相同的内存

[16]

。此外，任务

剩余15页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

APU性能评估：光线跟踪中的计算性能对比

gpu计算效果评估

apu2-documentation:用于构建和调整PC引擎APU2固件的文档和脚本

全球辅助动力装置（APU）市场概览：规模、主要厂商与未来趋势.pdf

woo-apu:WooCommerce REST API捆绑包

Mike Houston：异构计算，开启未来计算时代

apu_gpio_lib:用户空间库，用于访问APU23 gpios

CPU/APU：一场无声的反垄断技术较量

Fusion APU内存系统：GPU零拷贝优化

低成本APU与CPU/GPU性能对比：光线跟踪加速性能实证

AMD APU OpenCL教程：入门与GPU架构详解

最新资源