IBM LSF 8 Train Doc: Site-Defined Resources and ELIM

需积分: 10 8 下载量 195 浏览量 更新于2024-07-19 1 收藏 2.08MB PDF 举报
"IBM LSF 8 train doc 是一份关于IBM Platform LSF(Load Sharing Facility)8版本的培训文档,这份资料对于理解LSF系统以及与最新9.1.3版本的相似性非常有帮助。文档内容涵盖了LSF的自定义资源、外部负载信息管理器(ELIM)、主LIM、从属LIM和MELIM之间的交互、如何添加自定义共享资源、实施和管理ELIM以收集动态资源、查看和使用自定义共享资源、修改内置负载索引、配置LIM和ELIM的故障容错功能以及ELIM的控制等方面。" IBM LSF(Load Sharing Facility)是IBM提供的一款分布式计算集群管理软件,它能够有效地管理和调度跨多台服务器的工作负载,确保系统的资源得到最佳利用。在LSF 8的培训文档中,重点讲解了以下几个关键知识点: 1. **静态资源**:这些资源代表不变的信息,如CPU数量、主机类型和模型类型。它们在系统运行过程中一般不会发生变化。 2. **动态资源**:这类资源会周期性变化,如CPU使用率(ut)、交换空间(swp)、内存使用情况(r1m)。这些资源反映了系统的实时状态,并且对调度决策至关重要。 3. **共享资源**:可以被整个集群或部分主机共享的资源,如浮动许可证。使用共享资源会影响其他服务器主机对其的可见性和可用性。共享资源可以是静态的,也可以是动态的,动态共享资源的价值会通过某种机制进行收集和更新。 4. **外部负载信息管理器(ELIM)**:ELIM是LSF系统中的一个重要组件,负责收集和处理来自集群外部的动态资源信息,例如,当有新的硬件资源加入或离开集群时,ELIM能提供这些变化的信息。 5. **LIM(Load Information Manager)交互**:LSF系统中有主LIM、从属LIM和MELIM(多宿主LIM)的概念。它们协同工作,监控和管理集群中的资源分配和任务调度。主LIM是整个集群的中心节点,从属LIM负责监控各自的主机,而MELIM则用于支持跨越多个物理网络的集群。 6. **配置LIM和ELIM的故障容错**:这部分内容涉及到如何设置冗余和备份机制,以确保即使在单个组件失效的情况下,LSF系统仍能保持稳定运行。 7. **ELIM Control**:ELIM的控制功能允许管理员监控和调整ELIM的行为,包括设置资源收集频率、调整资源阈值等,以优化集群性能。 通过学习这个培训文档,用户将能够深入理解IBM LSF的工作原理,掌握如何配置和管理资源,以实现高效、可靠的分布式计算环境。这些知识对于任何使用或计划使用IBM LSF平台的IT专业人员都是至关重要的。