在slurm中, 已经配置了PreemptMode=SUSPEND,GANG. PreemptType=partition_rio, 但是高优先级分区中job还是不能抢占成功.
时间: 2023-06-25 08:04:01 浏览: 168
slurm安装的muge包和配置文件
如果已经将PreemptMode设置为SUSPEND,GANG,那么只有当有足够多的节点可供使用时,高优先级分区中的任务才会被抢占。如果您的高优先级分区中的任务仍然不能成功抢占,可能是因为以下原因:
1. 您的集群中没有足够的节点
如果您的集群中没有足够的节点可用,那么即使配置了PreemptMode=SUSPEND,GANG,高优先级分区中的任务也无法抢占低优先级分区中的任务。您可以使用sinfo命令查看可用节点的数量。
2. 您的高优先级分区中的任务已经达到了最大并发数限制
如果您的高优先级分区中的任务已经达到了最大并发数限制,那么即使有足够多的节点可用,也无法抢占低优先级分区中的任务。您可以使用scontrol show partition命令查看分区的最大并发数限制。
3. 您的低优先级分区中的任务正在运行I/O密集型操作
如果您的低优先级分区中的任务正在运行I/O密集型操作,那么即使高优先级分区中有足够的任务可以抢占,也可能无法成功抢占。这是因为I/O操作可能会导致任务暂停,从而阻止任务被抢占。您可以使用scontrol show job命令查看任务的状态。
您可以尝试通过增加节点数量、调整分区的最大并发数限制、或者避免低优先级分区中的任务运行I/O密集型操作等方式来解决这个问题。
阅读全文