使用HPC进行计算:Pittsburgh超算中心Bridges系统介绍

版权申诉
0 下载量 168 浏览量 更新于2024-08-04 收藏 2.08MB PDF 举报
"高性能计算(HPC)系统入门" 在科学与技术领域,高性能计算(HPC)系统扮演着至关重要的角色,特别是在大数据分析、机器学习以及复杂的模拟计算等方面。本资源是针对MATH1900:机器学习课程的一个介绍,旨在帮助用户了解如何在Pittsburgh超级计算中心(PSC)的BRIDGES系统上进行计算操作。 BRIDGES是Pittsburgh超级计算中心的主要系统,它是一个由800多台独立机器组成的大型计算机集群,其中包含图形处理单元(GPUs),这些GPU对于运行像keras这样的深度学习库特别有用。国家科学基金会(NSF)在1985年左右设立了几个超级计算中心,旨在为全国各地的研究人员和学生提供免费的顶级计算设施,而不再需要单个大学承担高昂的购置、安装、运行和升级成本。目前,NSF支持的四个主要超级计算中心分别位于伊利诺伊州厄巴纳的NCSA、宾夕法尼亚州匹兹堡的PSC、加利福尼亚州圣迭戈的SDSC以及德克萨斯州奥斯汀的TACC。 要开始在PSC的HPC系统上工作,首先需要创建一个账户。这个过程通常涉及申请步骤,可能需要通过教授或机构管理员的授权。一旦账户建立,用户便可以登录到系统,并进行文件传输和基本任务操作。文件传输通常通过FTP或安全FTP(SFTP)完成,以确保数据的安全性。 在HPC系统上执行任务时,理解集群的工作原理至关重要。计算任务被分配到集群的不同节点上并行处理,以提高效率。在BRIDGES系统上,由于有GPU的支持,可以显著加速机器学习和深度学习算法的训练过程。Keras库允许用户轻松地构建和训练神经网络模型,而GPU的并行计算能力则可以极大地减少训练时间。 此外,HPC系统的使用还需要掌握一定的命令行技能,因为大多数交互是通过终端或控制台进行的。用户需要熟悉基本的Linux命令,如`cd`(改变目录)、`ls`(列出目录内容)、`mv`(移动文件)和`cp`(复制文件)。同时,提交并行作业通常需要编写作业脚本,指定资源需求(如CPU核心数和内存大小)以及执行命令。 这个资源提供了进入HPC世界的初步指导,包括了如何访问PSC的BRIDGES系统,以及如何利用其强大的计算能力来执行机器学习任务。对于任何希望在高性能计算环境中运行计算密集型应用的人来说,这是一个非常有价值的起点。