神威众核处理器上的排列熵算法高效并行加速策略

需积分: 9 0 下载量 109 浏览量 更新于2024-08-13 收藏 1.36MB PDF 举报
本文主要探讨了如何在基于神威众核处理器的高性能计算平台上优化排列熵(Permutation Entropy,PE)算法,以应对随着嵌入维数增加导致的计算复杂度提升和对计算效率的需求。排列熵算法在复杂系统分析中有着广泛的应用,特别是在非线性动力系统识别和时间序列分析中。 针对神威·太湖之光这台国际上性能超过100P的异构众核超级计算机,研究者提出了一种针对排列熵算法的并行化策略。首先,他们利用消息传递接口(MPI)进行核组间的并行处理,将相空间矩阵的数据在不同的核组之间进行划分,实现跨核组的并行计算。这种方法能够有效利用多核处理器的并行能力,提高算法执行的效率。 在核组内部,研究人员采用OpenACC并行编程模型,进一步对划分后的区域进行并行化,增强了计算的并发性。OpenACC允许开发者编写面向特定硬件的加速代码,而无需修改底层代码,这对于适应神威众核处理器SW26010的特性尤为关键。 考虑到SW26010处理器的结构特点,如主从核的协作方式以及可能存在的原子操作,文章着重讨论了如何通过减少主从核之间的通信次数和避免不必要的原子操作来优化算法的性能。这些优化措施有助于降低并行计算中的通信开销和同步开销,从而显著提升算法执行速度。 通过大坝振荡数据的实验测试,研究结果证实了这一并行加速方法的有效性。结果显示,相比于主核版本,单核组性能最高可达到7.18倍的加速,显示出众核处理器的强大优势。而在大规模集群环境下,当使用128核组时,性能提升更是达到了惊人的85.6倍,这充分展示了神威·太湖之光在处理高维排列熵计算任务时的高效性和扩展性。 本文不仅提供了排列熵算法在神威众核处理器上的并行实现方法,还为其他类似高性能计算任务提供了重要的实践参考。作者团队包括张浩、花嵘、于建志、梁建国和冯鲁彬等研究人员,他们在并行与分布式计算领域具有丰富的经验和深厚的理论基础,他们的研究成果对于推动高性能计算技术在实际应用中的发展具有重要意义。