CPU-GPU异构并行技术在大规模科学计算中的优化研究

需积分: 35 63 下载量 5 浏览量 更新于2024-07-25 3 收藏 5.52MB PDF 举报
"面向大规模科学计算的CPU-GPU异构并行技术研究,硕士论文,国防科学技术大学,作者:方旭东,导师:唐玉华,2009年" 这篇硕士论文深入探讨了CPU-GPU异构并行技术在大规模科学计算中的应用,主要关注如何有效地利用GPU的高性能计算能力来加速科学计算任务。随着GPU硬件和编程模型的迅速发展,其在科学计算领域的潜力逐渐被发掘。然而,将科学计算应用移植到GPU并实现高效运行是一项挑战。 论文首先分析了CPU和GPU在异构系统中的角色。CPU处理复杂的逻辑运算和事务管理,而GPU则适合执行计算密集且逻辑简单的任务,以实现大规模数据并行计算。论文提出了两种优化策略:一是任务划分,通过比例划分法、曲线拟合法和搜索法等三种模型,适应不同类型的科学计算任务;二是通信优化,采用中间结果复用和长流分段技术减少CPU与GPU之间的数据传输延迟。 接着,论文针对AMD GPU的硬件特性和Brook+编程模型,提出了四种GPU并行优化策略。这包括平衡线程并行性和局部性以提高计算效率,消除分支以减少控制开销,开发指令级并行以提升计算密度,以及优化内存带宽利用率以最大化数据吞吐量。 在实证研究部分,论文选择了矩阵乘、LU分解和Mgrid这三个关键的科学计算程序,将它们移植到AMD GPU上,并应用上述优化策略进行优化。实验结果显示,这些程序的性能均有显著提升,证明了提出的异构并行优化技术的有效性。 该论文的工作为在CPU-GPU异构平台上开发和优化科学计算应用提供了理论依据和实践经验,对于推动大规模科学计算的发展具有积极的指导意义。关键词包括GPU、Brook+、流编程模型、科学计算和异构并行。