CPU-GPU异构系统：渐近拟合优化与源到源编译的结合

下载需积分: 10 | PDF格式 | 673KB | 更新于2024-09-06 | 168 浏览量 | 举报

"面向CPU-GPU源到源编译系统的渐近拟合优化方法，旨在解决CPU-GPU异构并行系统中应用移植后优化不足的问题。通过结合渐近拟合优化与源到源编译技术，对C语言程序插入指导语句后转换为CUDA语言，实现多次程序剖分，并根据源程序特性及硬件信息自动进行编译优化。这种方法已经应用于原型系统中，经过测试，生成的CUDA目标程序在功能上与原始C程序保持一致，性能显著提升，优于其他源到源编译工具生成的程序。" 在当前的计算机工程领域，由于处理器主频提升受限于功耗和散热问题，多核技术，尤其是异构多核技术成为了提升系统性能的关键路径。CPU-GPU架构作为异构多核系统的代表，利用CUDA统一计算架构简化了通用计算在GPU上的实现。然而，CUDA编程模型的多线程和多级存储结构依然对程序员提出了较高的移植和优化挑战。源到源编译技术在一定程度上解决了传统CPU应用向GPU的移植问题，但移植后的程序优化仍然是高性能计算领域的热点问题。针对这一挑战，研究者提出了一种新的方法，即将渐近拟合优化技术融入到源到源编译过程中。这种方法首先对C语言程序进行改造，插入特定的指导语句，然后将程序转换为CUDA语言。在此过程中，系统能够对转换后的CUDA程序进行多次剖分，依据源代码的特性以及硬件配置信息，自动进行源到源的编译优化。实现的原型系统展示了这种方法的有效性。在不同环境下，系统生成的CUDA目标程序不仅在功能上与原C程序保持一致，而且在性能上有显著提升。通过对比CUDA基准测试程序，该目标程序的性能优于其他源到源编译工具产生的结果，证明了该优化方法的优势。这项工作对CPU-GPU异构系统应用的优化具有重要意义，它提供了一种自动化程度高、适应性强的优化策略，有助于减轻程序员在移植和优化过程中的负担，促进高效能计算的发展。未来的研究可能进一步探索如何优化此方法，以适应更广泛的程序类型和硬件环境，以及如何将这种方法扩展到其他类型的异构计算平台。