"基于国产众核架构CESM中有限差分计算优化"
本文主要探讨了如何在国产申威26010众核处理器上优化通用地球系统模型(CESM)中的有限差分算法,以提高并行计算效率。CESM是一种复杂的气候模拟系统,其核心计算任务通常涉及到大量的数值计算,尤其是有限差分法,用于模拟地球大气、海洋等环境的物理过程。
在并行计算中,有限差分算法的内存访问模式往往导致大量冗余读取,这在没有共享缓存区的处理器上可能导致带宽利用率低下,进而影响整体性能。此外,通信开销也是并行计算中的关键问题,特别是在异构众核处理器上,如申威26010,它具有多核心架构,需要高效的数据传输和任务调度。
为了解决这些问题,研究团队提出了几种并行优化策略。首先,他们通过数据重构优化了数据结构,减少内存访问的冗余,提高了数据访问效率。其次,采用计算核心捆绑技术,将相关的计算任务分配到同一组核心上,降低了通信需求。最后,引入了流水线通信机制,使得数据在不同核心间传输更为高效,进一步降低了通信开销。
在申威26010处理器上针对CESM中的两个以有限差分法为核心的函数进行测试,这些优化策略实现了显著的性能提升,达到了21.2倍的速度提升。这一成果不仅提升了CESM在国产硬件平台上的运行效率,也为其他类似架构的处理器提供了优化有限差分算法的参考方法。
该研究由国家自然科学基金和中央高校基本科研业务费专项资金资助,由陈宏博、钱雪忠、甘霖、徐敬蘅和刘徐等研究人员共同完成。他们的工作聚焦于高性能计算、机器学习以及数据挖掘等领域,为国产处理器在科学计算领域的应用提供了重要支持。
关键词涵盖的领域包括:通用地球系统模型,这是一类复杂的多物理过程模拟系统;并行计算,是解决大规模计算问题的关键技术;异构众核处理器,这类处理器由不同类型的计算核心组成,适合执行多样化任务;有限差分算法,是数值分析中常用的离散化方法;高性能计算,是指能够处理大规模计算任务的计算能力。
总结来说,这篇论文揭示了如何针对国产申威26010众核处理器优化有限差分算法,以提高通用地球系统模型的计算效率,为高性能计算在国产硬件上的应用开辟了新的途径。通过数据结构优化、计算核心捆绑和流水线通信等策略,研究人员成功地减少了内存冗余和通信开销,实现了显著的性能提升。这些研究成果对于国产处理器在科学计算领域的广泛应用具有重要意义。