Gorque:Linux集群GPU作业调度器

需积分: 9 0 下载量 128 浏览量 更新于2024-12-22 收藏 14KB ZIP 举报
资源摘要信息:"Gorque是一个为基于Linux的计算机群集设计的程序,特别是那些具有启用CUDA的计算节点。这些节点需要能够运行nvidia-smi命令,并且能够将GPU的可用内存设置为11MB。Gorque的主要功能是根据预设的时间安排GPU作业,其中一些关键特点包括:一个计算节点只能运行一项工作,作业按优先级排队(较高优先级编号应首先执行)。 Gorque还关注每个节点的CPU使用率,将CPU作业与GPU作业一起提交给该节点。为了使用Gorque,需要有以下几个环境或者前提条件: 1. Torque PBS(Portable Batch System):这是Gorque用来提交和管理作业的主要工具,依赖于Torque PBS提供的命令如pbsnodes和qstat来获取节点状态信息,以及qsub命令来提交作业。 2. Python环境:Gorque依赖于Python 2.7或更高版本。如果使用的是CentOS系统,则可能默认只安装了Python 2.6版本。因为CentOS系统依赖于Python 2.6,所以不建议直接升级Python版本。在这种情况下,可以选择安装一个侧面版本的Python来满足Gorque的需求。 3. 安装过程可能还需要使用yum(Yellowdog Updater, Modified)包管理器,因为安装指令中提到了yum groupinstall "Devel"。这表明在安装Gorque之前,可能还需要安装一些开发相关的包。 Gorque的文件名称列表中包含了一个压缩包文件名"Gorque-master",这可能表示Gorque的源代码在github上托管,并且该压缩包可能包含了最新版本的源代码。" 在使用Gorque时,应当注意确保所有依赖项都已正确安装和配置,包括Torque PBS系统、Python环境以及相关的系统权限。在部署和运行Gorque之前,还需要仔细阅读相关的文档来了解如何进行配置和运行作业。如果计算节点的CPU使用率也作为考虑因素,则可能需要进一步配置系统以监控和管理CPU资源,以保证作业的顺利执行。