如何在Rocky Linux 8.6上安装和配置Slurm,最详细步骤
时间: 2024-10-03 21:04:58 浏览: 7
在Rocky Linux 8.6上安装和配置Slurm(Simple Linux Utility for Resource Management)可以分为几个关键步骤:
1. **更新系统和添加仓库**:
- 打开终端并运行:
```
sudo yum update -y
sudo dnf install epel-release
```
这里我们安装EPEL (Extra Packages for Enterprise Linux) 来获取Slurm的相关软件包。
2. **安装Slurm组件**:
```
sudo dnf install slurm-client slurm-slurmdbd slurmctld slurm-mysql slurm-mathlib
```
如果你想使用MySQL作为数据库,就安装`slurm-mysql`;如果选择自包含文件存储数据,则不需要这个。
3. **配置MySQL(可选)**:
- 安装MySQL,如果未安装:
```
sudo dnf install mysql-server
```
- 配置并启动MySQL,首次登录设置root密码:
```
sudo mysql_secure_installation
```
- 创建Slurm数据库用户并授权:
```sql
CREATE USER 'slurm'@'localhost' IDENTIFIED BY 'your_password';
GRANT ALL PRIVILEGES ON * . * TO 'slurm'@'localhost';
FLUSH PRIVILEGES;
```
4. **配置slurm.conf**:
- Slurm的主配置文件通常位于 `/etc/slurm/slurm.conf`。打开它,并根据系统需求进行编辑。例如,设置节点信息、分组、计算资源等。基础配置包括:
- `NodeName` 和 `PartitionName` 需要指定集群内的每个节点和分区名称。
- `AuthMethod` 设置认证方式,如`password` 或 `PAM`。
5. **配置MySQL数据库**:
- 使用文本编辑器创建或编辑 `/etc/slurm/mysql.conf` 文件,设置连接字符串和数据库表结构相关的参数。
6. **启动服务**:
- 启动Slurm控制台进程 (`slurmctld`) 和数据库服务 (`slurmd`):
```
sudo systemctl start slurmctld
sudo systemctl start slurmd
```
- 检查服务是否已成功启动,设置它们开机自动启动:
```
sudo systemctl enable slurmctld
sudo systemctl enable slurmd
```
7. **测试配置**:
- 使用命令行工具 `sinfo` 或 `scontrol show hostname` 确认Slurm是否能识别到你的节点。
- 在客户端运行 `sbatch` 或 `srun` 测试作业提交。
8. **安全管理**:
- 可能需要创建用户和分配特定的资源配额,参考Slurm文档进行操作。