在Linux中,输入salloc --gres返回的是什么?
时间: 2023-06-24 19:06:03 浏览: 302
当在 Linux 中输入 `salloc --gres` 命令时,返回的是一条提示信息,告诉您已经成功地向 Slurm 集群提交了一个作业请求,并且请求中包含了一个或多个 GPU 资源。其中 `--gres` 参数用于指定所需的 GPU 资源数量和类型。具体的提示信息内容会因不同的 Slurm 版本和配置而有所不同,但通常会包括作业 ID、预估的等待时间、分配的节点列表和 GPU 资源列表等信息。
相关问题
在Linux中,输入salloc --gres,返回提示我作业正在排队?那么我如何查询这个排队预计需要等待多长时间?
您可以使用`squeue`命令查询当前队列中的作业情况,包括作业的状态、预计等待时间等信息。例如,您可以使用以下命令查询正在排队的作业:
```
squeue -u <your_username> -t PD
```
其中,`-u`参数用于指定查询哪个用户的作业,`-t`参数用于指定查询哪种状态的作业,`PD`表示正在排队的作业。执行该命令后,您将会看到类似如下的输出:
```
JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON)
1234567 gpuq myjob.sh alice PD 0:00 1 (Priority)
```
输出中的`REASON`列会告诉您作业被挂起的原因,例如,如果显示`Priority`,则说明您的作业正在等待更高优先级的作业完成后才能开始执行。另外,`TIME`列会告诉您作业在队列中等待的时间。
在Linux中,输入sinfo,返回的每行信息分别表示了什么含义?
`sinfo`是Slurm Workload Manager的一个命令,用于显示有关当前集群状态的信息。每行返回的信息表示以下含义:
- `PARTITION`: 分区名称。
- `AVAIL`: 分区中可用的节点数。
- `TIMELIMIT`: 分区允许使用的最长时间。
- `NODES(A/I/O/T)`: 分区中的总节点数、已分配节点数、正在运行的节点数、和总共可用的节点数。
- `GRES`: 分区中可用的GPU、Infiniband等资源。
- `STATE`: 分区的状态,包括UP(正常)、DOWN(不可用)和DRAIN(正在维护)。
- `NODELIST`: 分配给该分区的节点列表。
- `FEATURES`: 节点的特性,例如CPU型号、内存大小等。
- `JOB_SIZE(Tasks/Cpus/Mem):` 该分区中所运行作业的任务数、CPU数和内存使用量。
- `PARTITION_CONFIG`: 分区的配置信息,包括节点数、节点列表、特性等。
阅读全文