Gorque:Linux集群GPU作业调度器
需积分: 9 128 浏览量
更新于2024-12-22
收藏 14KB ZIP 举报
资源摘要信息:"Gorque是一个为基于Linux的计算机群集设计的程序,特别是那些具有启用CUDA的计算节点。这些节点需要能够运行nvidia-smi命令,并且能够将GPU的可用内存设置为11MB。Gorque的主要功能是根据预设的时间安排GPU作业,其中一些关键特点包括:一个计算节点只能运行一项工作,作业按优先级排队(较高优先级编号应首先执行)。
Gorque还关注每个节点的CPU使用率,将CPU作业与GPU作业一起提交给该节点。为了使用Gorque,需要有以下几个环境或者前提条件:
1. Torque PBS(Portable Batch System):这是Gorque用来提交和管理作业的主要工具,依赖于Torque PBS提供的命令如pbsnodes和qstat来获取节点状态信息,以及qsub命令来提交作业。
2. Python环境:Gorque依赖于Python 2.7或更高版本。如果使用的是CentOS系统,则可能默认只安装了Python 2.6版本。因为CentOS系统依赖于Python 2.6,所以不建议直接升级Python版本。在这种情况下,可以选择安装一个侧面版本的Python来满足Gorque的需求。
3. 安装过程可能还需要使用yum(Yellowdog Updater, Modified)包管理器,因为安装指令中提到了yum groupinstall "Devel"。这表明在安装Gorque之前,可能还需要安装一些开发相关的包。
Gorque的文件名称列表中包含了一个压缩包文件名"Gorque-master",这可能表示Gorque的源代码在github上托管,并且该压缩包可能包含了最新版本的源代码。"
在使用Gorque时,应当注意确保所有依赖项都已正确安装和配置,包括Torque PBS系统、Python环境以及相关的系统权限。在部署和运行Gorque之前,还需要仔细阅读相关的文档来了解如何进行配置和运行作业。如果计算节点的CPU使用率也作为考虑因素,则可能需要进一步配置系统以监控和管理CPU资源,以保证作业的顺利执行。
614 浏览量
306 浏览量
2021-06-16 上传
2021-04-23 上传
511 浏览量
2021-06-13 上传
2021-04-30 上传
国服第一奶妈
- 粉丝: 33
- 资源: 4505
最新资源
- alfred-abbr:关于缩写的阿尔弗雷德(Alfred)工作流程
- 企业新员工的非制度性培训DOC
- ChristineCao98.github.io
- app-algoexpert:ClémentMihailescu和AlgoExpert的软件工程项目CONTEST的获奖项目-2020年冬季
- 娱乐休闲会所大厅模型
- optical-character-recognition-OCR:使用CNN预测验证码图像中的文本
- introduction-to-node-mongo
- 企业-汇创达-2020年年终总结.rar
- 新员工入职培训教材
- soundphase
- Transfer Function V2.2:这是控制计算器 GUI,适用于希望查看传递函数的各种结果的人。-matlab开发
- Unity 特效资源包 TopDownEffects
- 休闲书房三维模型设计
- The Annoy-O-Bug:鸣叫的灯光鸟-项目开发
- 电信设备-去除三氯氢硅中硼杂质的方法.zip
- arnab-dibosh.github.io:商业组织的网站