使用HPC进行计算:Pittsburgh超算中心Bridges系统介绍
版权申诉
201 浏览量
更新于2024-08-04
收藏 2.08MB PDF 举报
"高性能计算(HPC)系统入门"
在科学与技术领域,高性能计算(HPC)系统扮演着至关重要的角色,特别是在大数据分析、机器学习以及复杂的模拟计算等方面。本资源是针对MATH1900:机器学习课程的一个介绍,旨在帮助用户了解如何在Pittsburgh超级计算中心(PSC)的BRIDGES系统上进行计算操作。
BRIDGES是Pittsburgh超级计算中心的主要系统,它是一个由800多台独立机器组成的大型计算机集群,其中包含图形处理单元(GPUs),这些GPU对于运行像keras这样的深度学习库特别有用。国家科学基金会(NSF)在1985年左右设立了几个超级计算中心,旨在为全国各地的研究人员和学生提供免费的顶级计算设施,而不再需要单个大学承担高昂的购置、安装、运行和升级成本。目前,NSF支持的四个主要超级计算中心分别位于伊利诺伊州厄巴纳的NCSA、宾夕法尼亚州匹兹堡的PSC、加利福尼亚州圣迭戈的SDSC以及德克萨斯州奥斯汀的TACC。
要开始在PSC的HPC系统上工作,首先需要创建一个账户。这个过程通常涉及申请步骤,可能需要通过教授或机构管理员的授权。一旦账户建立,用户便可以登录到系统,并进行文件传输和基本任务操作。文件传输通常通过FTP或安全FTP(SFTP)完成,以确保数据的安全性。
在HPC系统上执行任务时,理解集群的工作原理至关重要。计算任务被分配到集群的不同节点上并行处理,以提高效率。在BRIDGES系统上,由于有GPU的支持,可以显著加速机器学习和深度学习算法的训练过程。Keras库允许用户轻松地构建和训练神经网络模型,而GPU的并行计算能力则可以极大地减少训练时间。
此外,HPC系统的使用还需要掌握一定的命令行技能,因为大多数交互是通过终端或控制台进行的。用户需要熟悉基本的Linux命令,如`cd`(改变目录)、`ls`(列出目录内容)、`mv`(移动文件)和`cp`(复制文件)。同时,提交并行作业通常需要编写作业脚本,指定资源需求(如CPU核心数和内存大小)以及执行命令。
这个资源提供了进入HPC世界的初步指导,包括了如何访问PSC的BRIDGES系统,以及如何利用其强大的计算能力来执行机器学习任务。对于任何希望在高性能计算环境中运行计算密集型应用的人来说,这是一个非常有价值的起点。
2022-09-23 上传
126 浏览量
420 浏览量
125 浏览量
197 浏览量
199 浏览量
446 浏览量
2024-12-31 上传
2023-07-15 上传