Tesla GPU 集群服务器使用手册
v0.93 (2010-1-11)
一、系统环境简介
Tesla GPU 集群服务器域名为 tesla.sccas.cn,IP 地址为 159.226.49.76(暂定),
内部用户可以在办公网内直接使用 SSH 登录该集群,外部用户同样需要经过防火墙身份认
证之后(认证过程请参见《深腾 7000 远程登录指南》)再进行 SSH 登录。数据的上传与
下载仍然是通过 scp 或者 sftp 方式进行。Tesla GPU 集群服务器的系统环境如下:
1)硬件环境:
● 头节点 1 个,机器名 console,配备一颗 Intel Xeon E5504 四核处理器,2.0GHz
主频,2*4MB 缓存,8G 内存,6 块 300GB SAS 硬盘,工作于 Raid5 模式。
● 计算节点 90 个,存在两种不同硬件配置,其机器名分别如下:
c0101-c0110、c0201-c0203、c0301-c0305(共 18 个节点)
以上节点配置一颗 AMD Phenom 9850 四核处理器,2.5GHz 主频,4*256KB
二级缓存,4MB 三级缓存,3 块 Tesla C1060 GPU 处理器,8GB 内存,一块 500GB
SATA 硬盘。
c0204-c0233、c0401-0442(共 72 个节点)
以上节点配置一颗 Intel Xeon E5410 四核处理器,2.33GHz 主频,2*6MB 二级
缓存,2 块 Tesla C1060 GPU 处理器,8GB 内存,一块 500GB SATA 硬盘。
各节点间通过 DDR 4X Infiniband 高速网络和千兆以太网进行连接,分别用于计
算数据和系统管理信息的通讯。
2)软件环境:
RHEL 5.3 x64 操作系统,内核版本 2.6.18-128.el5。
GNU C/C++/Fortran 编译器。
Nvidia CUDA Toolkit 2.1 开发工具。
Mvapich/OpenMPI 并行编程环境。
Atlas/GotoBlas 数学函数库。
Torque/Maui 资源管理系统及作业调度器。
Ganglia 集群监控系统。
3)文件系统:
除 console 外所有节点通过 NFS 挂载 console 的/export 目录,包括 console 在
内的所有节点的/home 目录为/export/home 目录的软链接。由于文件系统性能不高,建
议不要在该集群上运行会造成大规模并行或复杂 I/O 的应用程序。
评论1