多目标代码优化与GPU应用：解锁代码生成效率

PDF格式 | 2.46MB | 更新于2024-06-18 | 123 浏览量 | 举报

本篇论文深入探讨了"多时间代码生成器与多目标代码优化"这一主题，由维克多·洛米勒撰写，于2014年在格勒诺布尔大学完成，收录于HAL多学科开放存取档案馆。论文主要关注的是在软件工程领域中的一个重要议题，即如何通过创新技术提高代码生成效率和优化多目标性能，特别是在GPU（图形处理器）上的应用。论文首先介绍了背景和面临的新的编程挑战，指出传统编译器在处理并行计算、动态代码和数据性能优化方面的局限性。作者强调了在GPU上实现高性能计算的关键，因为数据和性能之间的关系对算法设计至关重要。动态代码生成技术被探讨，因为它能够适应硬件变化，提升执行效率。为了实现这些目标，作者开发了两种工具：deGoal，一种面向生成器的方法，它专注于生成高效的代码；以及Kahuna，一个功能导向的方法，通过结构化的方式进行优化。论文特别关注了矩阵乘积（GEMM）在GPU上的应用，这是一种常见的并行计算任务，通过分析和优化其代码，展示了如何利用GPU的优势。此外，论文还涵盖了机器学习和自动调谐的元素，这些技术在优化代码性能时扮演了重要角色。作者不仅总结了当前的技术水平，还讨论了未来的发展方向和可能的改进点，如适应不断变化的硬件环境和不断提升的性能需求。评审团成员包括来自不同学术机构的专家，他们对论文进行了细致的评审，并提出了宝贵的建议。整个研究工作在CEA格勒诺布尔芯片实验室进行，显示出作者在该领域的扎实基础和实践经验。这篇论文对于理解多时间代码生成器和多目标代码优化在现代高性能计算中的重要性，以及如何通过创新工具和技术来应对这些挑战提供了深入的见解。对于软件工程师、研究人员和GPU开发者来说，这是一份重要的参考资料。

展开