多节点GPU上并行粒子加速器束动力学模拟实现

0 下载量 78 浏览量 更新于2024-07-16 收藏 1.87MB PDF 举报
"这篇论文详细介绍了在多节点GPU系统上实现粒子加速器束动力学代码的并行化策略,以提高粒子模拟的效率和性能。研究人员利用两种并行化方法,针对不同规模的问题和硬件配置,探讨了在具有多个GPU的多节点混合架构计算机上运行粒子加速器模拟的优势。通过在橡树岭领导力计算设施的资源上进行优化,他们成功地将GPU PIC代码扩展到64个GPU,处理高达1600万个粒子的情况。" 在粒子加速器领域,粒子束动力学的精确模拟是理解和设计关键过程的关键。粒子加速器广泛应用于科学研究和工业应用,如高能物理实验、医学成像和材料改性。粒子在细胞内(PIC)方法是一种常用的自洽多粒子模拟技术,它允许科学家模拟带电粒子在加速器内部的行为。然而,这种模拟过程计算量巨大,对计算资源的需求很高。 论文中,作者实施了一种并行化的束动力学PIC代码,以适应现代多节点GPU环境。他们对比了两种并行化策略:复制方法和域分解方法。复制方法适用于中等规模的问题和当前的硬件,而在处理大规模问题和未来更先进的硬件时,域分解方法可能更为有效,因为它能够实现GPU间的直接通信,从而提高并行性能。 在橡树岭领导力计算设施的多节点混合架构计算机上,经过优化的GPU PIC代码展示出良好的并行性能。这表明,通过这样的并行化策略,可以有效地扩展模拟的规模,处理大量粒子的情况,例如达到1600万个粒子的规模,同时使用64个GPU。这样的扩展能力对于进行高分辨率和复杂系统的模拟至关重要,有助于加速粒子加速器的研究进程,进一步推动科学发现和技术进步。 这篇研究发表在《软件工程与应用》期刊2019年第12期,展示了并行计算技术在粒子物理学领域的应用,为未来的高性能计算和粒子加速器设计提供了有价值的参考。通过深入理解并优化多GPU环境下的并行算法,科研人员能够解决更复杂的问题,提高计算效率,从而推动粒子加速器技术的创新和发展。