优化多集群异构环境下的科学工作流调度策略

0 下载量 46 浏览量 更新于2024-08-28 收藏 1.3MB PDF 举报
本文主要探讨了在非专用异构多集群平台上对科学工作流进行调度的问题。科学工作流(Scientific Workflow)通常由并行任务图(Parallel Task Graphs, PTGs)构成,这是一种数据并行任务的图形表示,通过增加数据并行性,可以提升工作流程的性能和可扩展性。然而,科学工作流任务既具有数据并行性,又具有灵活性,这意味着它们可以在不同的节点上执行,这些节点不仅种类各异(异构性),而且可能不是专门为工作流设计或预留的(非专用性)。 在这样的多集群环境中,有效的调度策略至关重要。文章的作者,张景辉、罗俊洲和董芳,来自南京东南大学计算机科学与工程学院,他们关注的焦点在于如何在复杂的系统和软件环境下,设计出一个既能充分利用异构资源又能处理任务动态变化的高效调度算法。他们提出了一个结合分支定界(Branch-and-cut)方法的工作流调度方案,该方法旨在优化资源分配,平衡任务间的依赖关系,同时考虑到节点间的通信延迟和任务的执行时间。 论文首先回顾了现有的工作流调度研究,然后详细阐述了他们的方法论,包括如何构建任务模型,如何识别关键调度参数,以及如何利用分支定界技术来搜索最优调度方案。他们可能还讨论了挑战,如如何处理动态任务添加或删除、如何处理资源利用率不均等问题,以及他们在实验中的评估指标,如执行时间、资源利用率和吞吐量。 由于论文的最终目的是为了提供一个在非专用异构多集群环境下有效管理科学工作流的实用工具,因此它不仅涵盖了理论分析,还可能包含了一定的实证研究结果,展示了其调度策略在实际场景中的性能表现。 总结来说,这篇研究论文深入探讨了科学工作流在非专用异构多集群平台上的调度问题,提供了基于分支定界算法的解决方案,并通过实验验证了其在性能和效率方面的优势。这对于理解和改进分布式计算环境下的工作流管理具有重要的理论和实践价值。