基于Torque的自适应负载调度优化策略

0 下载量 114 浏览量 更新于2024-08-31 收藏 491KB PDF 举报
在高性能计算集群管理中,"基于Torque的新型作业调度策略的研究"是一个关键领域,它强调了作业调度在系统效能提升中的核心作用。当前的研究趋势主要侧重于单个调度策略的优化,但很少有文章探讨如何整合多种策略以实现更高效的整体运行。本文提出了一种创新方法,即根据节点负载动态调整作业的自定义优先级回填策略。 这个策略的主要特点是针对集群作业的独特运行特性,它能够实时分析每个节点的负载情况,从而为高优先级的作业分配资源,降低等待时间,提升整体计算效率。作者选择Torque作为研究平台,因为它是开源的,拥有广泛社区支持,且灵活性强,适合进行定制化开发。 Torque,起初称为PBS,由NASA等多个机构合作开发,旨在处理大规模并行作业的调度。其基本架构包括pbs_sched FIFO调度器和其他可扩展的调度器,如Maui。商业版本的PBSpro和开源的Torque在功能上有所不同,前者更注重商业化应用,后者则提供了更多的灵活性。 由于研究中的作业对运行时间和I/O吞吐率有较高要求,作者对Torque进行了定制开发,增加了新的自定义优先级调度功能。通过与原有调度策略的对比实验,作者将展示这种新型策略在实际应用中的优势,如减少资源浪费、提升任务完成速度等,这对于高性能计算集群的优化具有显著意义。 这篇论文不仅深入探讨了作业调度在高性能计算集群中的作用,还创新性地提出了一个基于节点负载的调度策略,旨在提升系统的整体性能和效率,这对于优化大型分布式计算环境具有很高的实用价值。