FPGA并行算法与结构优化:加速大数据矩阵计算
需积分: 47 171 浏览量
更新于2024-08-07
收藏 6.92MB PDF 举报
"本论文《结构模型实例:高性能计算在大数据中的方法论与应用》由国防科学技术大学的邬贵明博士于2011年撰写,研究方向聚焦于FPGA(现场可编程门阵列)在矩阵计算领域的并行算法设计和硬件结构优化。FPGA作为一种可重构计算平台,因其集成的硬件资源增多,计算能力增强,正在逐步推动可重构超级计算的发展。
论文主要针对FPGA在矩阵计算中的挑战进行深入探讨,如硬件编程复杂性、资源占用、存储和带宽需求以及可扩展性问题。作者首先提出了一个面向基本矩阵运算的FPGA设计方法,特别是高存储效率的分块矩阵乘并行结构。通过时空映射和模型构建,设计了一种自动生成并行结构的框架,通过对数据传输和存储进行优化,有效降低存储需求至O(b)而非O(b^2),提高了计算性能。
其次,论文提出了FPGA列选主元LU分解的细粒度流水线并行算法,以及相应的线性阵列实现,旨在充分利用流水线并行和数据重用,适用于线性方程组求解的扩展。作者还设计了全硬件实现的稠密线性方程组求解的并行结构,其中的核心是线性阵列,能同时处理列选主元LU分解和下三角方程组求解,且性能优于同类软件实现。
最后,论文针对稠密矩阵分解提出了一种分块策略和FPGA实现方法,采用不选主元LU分解,通过循环分块和时空映射等技术进行优化,实现了高效并行处理。这种分而治之的策略使得FPGA在处理大规模矩阵分解时展现出优势。
邬贵明博士的研究工作不仅解决了FPGA在矩阵计算中的关键问题,还提供了高效的硬件结构和算法,对于高性能计算在大数据环境中的实际应用具有重要意义,为FPGA在可重构超级计算中的角色奠定了坚实基础。"
139 浏览量
2017-10-18 上传
120 浏览量
104 浏览量
161 浏览量
111 浏览量
120 浏览量
727 浏览量
2010-04-17 上传
一土水丰色今口
- 粉丝: 23
- 资源: 3953