slurm安装教程ubuntu
时间: 2023-11-14 19:06:28 浏览: 60
Slurm 是一个开源的集群管理系统,下面是在 Ubuntu 上安装 Slurm 的简要教程:
1. 更新系统软件包:
```
sudo apt update
```
2. 安装必要的依赖软件包:
```
sudo apt install munge libmunge2 libmunge-dev
sudo apt install mariadb-server mariadb-client libmysqlclient-dev
sudo apt install slurm-wlm slurm-wlm-basic-plugins
```
3. 配置 Munge:
创建一个随机密钥:
```
sudo dd if=/dev/urandom bs=1 count=1024 > /etc/munge/munge.key
sudo chown munge:munge /etc/munge/munge.key
sudo chmod 400 /etc/munge/munge.key
```
启动 Munge 服务:
```
sudo systemctl enable munge
sudo systemctl start munge
```
4. 配置 MariaDB 数据库:
启动 MariaDB 服务:
```
sudo systemctl enable mariadb
sudo systemctl start mariadb
```
运行以下命令配置数据库:
```
sudo mysql_secure_installation
sudo mysql -u root -p < /usr/share/doc/slurm-wlm/examples/db_setup.mysql
```
5. 配置 Slurm:
编辑 `/etc/slurm-llnl/slurm.conf` 文件,根据需要修改配置项。至少需要设置以下选项:
- `ControlMachine`:指定 Slurm 控制节点的主机名或 IP 地址。
- `NodeName`:指定计算节点的名称和 IP 地址。
- `PartitionName`:定义分区的名称和节点列表。
6. 启动 Slurm 服务:
```
sudo systemctl enable slurmctld
sudo systemctl start slurmctld
sudo systemctl enable slurmd
sudo systemctl start slurmd
```
7. 验证安装:
运行以下命令来检查 Slurm 的状态:
```
sinfo
scontrol show partition
```