在slurm 中, 使用scontrol 创建的分区, 怎么突然丢失了,找不到了? 是否要保存, 请举例说明
时间: 2023-10-09 16:12:13 浏览: 74
在 Slurm 中,使用 scontrol 命令创建的分区是存储在 Slurm 控制节点上的配置文件中的。如果配置文件被修改或删除,那么分区也会丢失。另外,如果 Slurm 集群中的控制节点发生故障,并且没有进行备份,那么也会导致分区丢失。
为了避免分区丢失,可以将 Slurm 的配置文件备份到其他安全的地方。例如,可以将配置文件复制到另一台服务器上,或者将其存储在云存储中。如果出现故障,可以使用备份文件来恢复 Slurm 集群的配置。
下面是一个示例命令,可以使用 scontrol 命令创建一个名为 "test" 的分区:
```
scontrol create partition name=test
```
如果要将该分区保存到 Slurm 配置文件中,可以使用以下命令:
```
scontrol save partition=test
```
这将在 Slurm 配置文件中创建一个名为 "test" 的分区配置。如果配置文件被修改或删除,可以使用以下命令将分区重新加载到 Slurm 中:
```
scontrol update partition=test
```
这将从配置文件中重新加载 "test" 分区的配置,并将其添加到 Slurm 集群中。
相关问题
在slurm 中, 使用scontrol 创建的分区write slurm.conf 文件, 但是重新加载 configure 文件后又丢失 ?
在Slurm中,`scontrol`命令是用于管理Slurm集群的强大工具之一。使用`scontrol`命令创建的分区是临时的,它们存储在内存中,而不是在`slurm.conf`文件中。因此,当您重新加载配置文件时,由于`scontrol`命令创建的分区并不是永久的,所以它们会被丢失。如果您想要创建永久的分区,您需要手动将分区信息添加到`slurm.conf`文件中,并重新加载配置文件。
在slurm 中, 使用sacctmgr 给以添加的 user 增加分区 . 举例说明
好的,下面是在 Slurm 中使用 sacctmgr 给已添加的用户增加分区的步骤:
1. 确认你有足够的权限来管理用户和分区。通常情况下,只有管理员才有这些权限。
2. 打开终端并登录到 Slurm 集群的管理节点。
3. 运行以下命令以添加一个分区:
```bash
sacctmgr add cluster <cluster_name> partition <partition_name>
```
其中,`<cluster_name>` 是集群的名称,`<partition_name>` 是要添加的分区的名称。
4. 运行以下命令以添加用户并将其分配到分区:
```bash
sacctmgr add user <username> account=<account_name> partition=<partition_name>
```
其中,`<username>` 是要添加的用户的用户名,`<account_name>` 是用户所属的账户名称,`<partition_name>` 是要将用户分配到的分区的名称。
5. 确认用户已被添加并分配到了正确的分区。运行以下命令:
```bash
sacctmgr show user <username> -p
```
该命令将显示用户的详细信息,包括分配给他们的分区。
注意:以上命令中的 `<cluster_name>`,`<partition_name>`,`<username>`,`<account_name>` 都需要根据实际情况进行替换。