"浪潮高性能计算集群培训手册:实用操作指南及常见问题解决(v1.3)"
需积分: 0 53 浏览量
更新于2024-03-14
收藏 1.25MB PDF 举报
浪潮高性能计算集群培训手册 v1.3
本手册旨在为浪潮高性能计算集群用户提供必要的培训和操作指南,以便他们能够充分利用集群的性能和资源进行科研和工程计算。浪潮高性能计算集群是基于先进的技术和架构设计而成,具备自动化、标准化、服务化和AI驱动的特点,能够满足用户在大规模计算、AI 训练和其他计算密集型任务方面的需求。
集群概况
浪潮高性能计算集群目前拥有1个管理登录节点和28个计算节点。其中,28个计算节点分别配置了15个瘦计算节点、9个GPU节点和4个胖节点,分成三个分区,分别是CPU、GPU、和fat分区。登录节点作为用户使用集群的唯一入口,用户的所有操作(代码及数据上传、作业脚本编写)均在此节点完成。CPU分区适用于纯CPU计算类型的应用程序,而GPU分区则适用于需要GPU加速的应用程序。胖节点则提供更高的内存和计算资源,能够满足一些需要大内存的计算任务。
集群登录及文件传输
用户可以通过SSH协议使用登录节点,通过个人账号和密码进行远程连接和登录。对于文件传输,用户可以使用FTP或SCP等协议将本地文件传输到集群节点中,并进行操作和计算。此外,也可以利用集群节点进行数据下载和备份操作。
Slurm调度系统简介
集群采用基于Slurm的作业调度系统,可以通过命令行或脚本的方式提交任务,实现资源的合理分配和利用。Slurm支持用户对计算节点资源的请求、管理和调度,能够满足不同类型任务的运行需求。
Slurm常用命令操作介绍
本章介绍了Slurm常用的命令操作,包括任务的提交、查看、取消以及作业的管理等内容。用户通过学习和掌握这些命令,可以更加高效地使用集群资源,提高计算效率。
Slurm脚本作业
为了更加便捷和高效地提交作业,用户可以将任务的相关参数和指令封装到脚本中,然后通过Slurm系统进行调度和执行。本章提供了脚本作业的编写和提交方法,以及一些常见问题的解决方案,帮助用户进行作业的定制化和优化。
交互式作业
对于一些需要实时交互和调试的任务,集群也支持交互式作业模式。用户可以通过登录节点直接进行交互式的计算任务,实时观察和调试程序的运行情况,提高编程和调试的效率。
除了以上内容之外,本手册还包括了对集群自动化、无状态化、CMDB化和标准化等特点的介绍,以及对常见问题的解决方案和用户操作的指导。通过本培训手册,用户可以更全面地了解和掌握浪潮高性能计算集群的相关知识和操作技巧,从而更好地利用集群资源进行科研和工程计算,推动计算科学和技术创新的发展。
Inspur Internal Use Only | Inspur Confidential© 2020 INSPUR CORPORATION
注:本手册仅限内部使用,未经授权,不得外传。 © 2020浪潮集团
104 浏览量
290 浏览量
306 浏览量
2024-05-07 上传
306 浏览量
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
小赵同学871
- 粉丝: 103
- 资源: 1
最新资源
- 西门子伺服电机介绍 pdf
- 庖丁解牛—纵向切入ASP.NET 3.5控件和组件开发技术.pdf
- ARM JTAG 调试原理
- 松下A4数字交流伺服安装调试说明书.pdf
- GNU Make 项目管理 英文版
- Math\第2章 MATLAB编程与作图.ppt
- 课程管理系统毕业设计论文
- Oracle9i&10g编程艺术_英文版
- vmware下linux的联网设置
- Hibernate References
- 传感器网络节点定位系统安全性研究
- XML文件XML Schema.docXML Schema.doc
- C语言程序设计试题精编
- Silverlight - MS Press
- 2008全国计算机模拟题库
- 集成运算放大器及基本运算电路