GPU并行重启PGMRES算法:加速大规模稀疏线性方程组求解

需积分: 0 2 下载量 46 浏览量 更新于2024-09-05 收藏 657KB PDF 举报
本文主要探讨了"论文研究-基于GPU的重启PGMRES并行算法研究",该研究关注的是如何提升稀疏线性方程组求解效率,特别是在大规模工程问题中的应用。在现代工程问题中,由于复杂性增加,往往需要依赖有限元方法将偏微分方程离散为大规模稀疏线性系统,这在实际计算中占据了相当大的比例,有时甚至高达80%。 传统的求解方法包括直接法和迭代法。直接法虽然能提供精确解,但当系数矩阵不规则时,会导致存储需求和计算时间增加。相比之下,迭代法如GMRES(广义最小残差法)因其保持矩阵稀疏性,节省存储开销而被广泛用于解决大型稀疏线性系统。特别是重启技术与预条件技术结合的GMRES算法,展现了良好的稳定性和收敛性。 2014年以来,随着并行计算的兴起,特别是CUDA编程架构的引入,越来越多的研究者开始探索利用GPU进行通用计算,因为GPU能在较低成本和能耗下提供强大的计算性能。论文的作者陈华和史悦戎针对这一趋势,提出了一种基于CUDA的重启PGMRES并行算法。CUDA是一种异构架构下的并行编程模型,它允许在CPU和GPU之间无缝协作。 他们提出的算法创新之处在于采用了ELL压缩存储格式,这种新的存取方式有助于减少内存访问的开销。同时,他们根据问题规模和GPU Streaming Multiprocessors (SM)的数量,设计了一种动态线程分配策略,旨在优化资源利用,提高算法的并行效率。实验结果显示,这种方法显著提升了SM资源的利用率,从而实现了3到10倍的加速比,证明了在大规模稀疏线性方程组求解中的实际效能。 这项研究不仅提升了稀疏线性方程组求解的并行化程度,而且通过CUDA平台实现了高效且稳定的算法实现,对于处理大型工程问题中的计算挑战具有重要的实际意义。