SGE向LSF迁移指南:快速参考

需积分: 9 3 下载量 127 浏览量 更新于2024-08-12 收藏 159KB PDF 举报
SGE_to_LSF_User_Migration_Guide.pdf 是一份针对Sun Grid Engine (SGE) 集群管理员和用户迁移至Platform LSF的实用指南。这份文档详尽地阐述了如何在两种集群资源调度系统间进行转换,特别是关注以下几个关键领域: 1. **Job Submission**: SGE 使用`qsub`命令进行作业提交,这与LSF的`bsub`功能类似。SGE在交互式批量作业提交上有限,通常需要配合`qrsh`使用。相比之下,LSF提供了更多的交互式批量作业提交选项,这为用户提供了更大的灵活性。 2. **Job States**: 迁移过程中,理解两个系统中的作业状态至关重要。指南会解释SGE中的作业状态(如`pending`, `running`, `held`, `completed`等)在LSF中如何对应,并指导用户如何在新环境中跟踪和管理这些状态。 3. **Job Monitoring**: 对于作业监控,文档对比了SGE和LSF的监控工具,如`qstat`和`lsf_info`,以及它们提供的信息和界面差异。这有助于用户熟悉LSF的实时监控功能,以便于在新平台上及时掌握任务运行情况。 4. **Job Controls**: SGE的作业控制如`qdel`, `qmod`, `qalter`等在LSF中有相应的命令,如`bkill`, `bkillall`, `bsub -k`等,但操作方式和参数可能有所不同。指南详细列出了这些控制命令的转换方法。 5. **Cluster Configuration & Cluster Information**: - **Batch Cluster Configuration**: 系统配置的转换涉及资源管理器(如`qmaster` vs. `scheduler`)、队列管理(`qconf` vs. `bsubd`配置),以及调度策略的调整。 - **Batch Cluster Information**: 如节点信息、硬件资源、网络配置等内容,迁移时需要确保正确映射到LSF的集群架构中。 - **Batch Limits**: SGE的资源限制如内存、CPU份额等在LSF中通过`-R`选项或`limit`命令设置,需理解其不同之处。 - **Environment Variables**: 指导用户如何在新系统中设置或更新环境变量,以保持原有脚本的兼容性。 6. **SGE vs. LSF Daemons**: 文档还比较了SGE的核心服务(如`grid_engine`)与LSF的守护进程(如`scheduler`, `manager`, `execd`),帮助用户理解和适应新的服务架构。 通过阅读这份迁移指南,用户将能够有效地从SGE向LSF转变,确保在新环境中作业管理的顺畅和高效。同时,它也揭示了LSF的新增功能和优势,帮助用户充分利用新平台的优势。