PBS作业调度系统在机群安装与管理

需积分: 47 39 下载量 34 浏览量 更新于2024-08-25 收藏 533KB PPT 举报
本文主要介绍如何在机群上安装Linux作业管理系统PBS(Portable Batch System)。PBS是一种广泛使用的作业调度系统,尤其适用于处理大规模计算任务的集群环境。 PBS作业调度系统 PBS作业调度系统是任务管理系统的一种,它独立于操作系统,提供基于作业级别的调度。这种系统允许用户提交任务到一个中央队列,然后根据预设的调度策略来分配资源,执行作业,并在完成后进行收尾工作。PBS特别适合处理不同类型的作业,包括串行和并行任务,并且具备资源管理和用户权限控制功能。 机群使用中的问题 在机群环境下,存在一些挑战,如松散的系统结构(单一系统映象)、节点间配置差异、丰富的系统资源、多用户作业需求以及资源使用的限制。为了解决这些问题,任务管理系统如PBS成为必需。 任务管理系统功能 任务管理系统的主要功能包括: 1. 单一系统映象:整合松散的机群结构,使用户能像使用单个系统一样操作整个集群。 2. 系统资源整合:管理异构系统资源,优化不同硬件配置的使用。 3. 多用户管理:统一调度用户提交的任务,避免冲突。 4. 用户权限管理:控制非授权用户的访问,确保系统安全。 任务管理系统的简史和发展 早期的任务管理系统主要是基于进程级别的调度,而PBS为代表的作业级调度系统提供了更高级别的管理,包括基于全局信息的策略性作业调度、资源预订和全程交互控制。 任务管理系统的分类 1. 基于进程级别的调度:由操作系统或Runtime支持,关注当前运行的作业,实现基本的负载均衡。 2. 基于作业级别的调度:如PBS,通过独立系统接收、调度任务,提供更灵活的资源分配和高级管理策略。 比较不同级别的任务管理系统,作业级调度如PBS在负载均衡、资源分享、服务质量(QoS)保证以及系统扩展性等方面具有优势。 机群一致性 PBS等作业级调度系统提供单一系统入口和存储一致性,确保了机群的一致性。此外,它们支持对用户权限、资源和作业的高级管理策略,适应大规模、多样化的计算需求。 总结 在Linux机群中安装PBS作业管理系统,可以有效地解决机群环境中的各种问题,提供高效、公平的资源调度和任务管理。PBS不仅管理硬件资源,还支持软件和证书等资源的共享,同时具备良好的可扩展性和对各种作业类型的适应性,确保了高质量的服务和优化的性能。
2011-04-13 上传
Linux 下使用! PBS是一个批处理作业和计算机系统资源管理软件包。它原本是按照POSIX 1003.2d批处理环境来开发的。这样,它就可以接受批处理作业、shell脚本和控制属性,作业运行前对其储存并保护,然后运行作业,并且把输出转发回提交者。   PBS可以被安装并配置运行在单机系统或多个系统组来支持作业处理。由于PBS的灵活性,多个系统可以以多种方式组合。 PBS的组件   PBS包括四个主要的组件:命令组件、作业服务器、作业执行组件和作业调度器。这里给出每一部分的简要描述来帮助你在安装过程中做出决定。   命令组件:   PBS支持与POSIX1003.2d相一致的命令行和图形接口两种命令方式。这些命令用于提交、监视、修改和删除作业。命令可以被安装在任何PBS支持的系统类型上,并且不需要在本地安装任何其它的PBS组件。共有三种类型的命令:任何已授权用户可以使用的命令;操作员命令;管理员命令;操作员和管理员命令需要不同的访问权限。   作业服务器:   作业服务器是PBS的中心。在本文档中,它一般被称作服务器或被称为可执行文件的名字pbs_server。所有命令和其它守护进程都通过IP网络和服务器通信。服务器的主要功能就是提供基本的批处理服务,例如接收/创建一个批处理作业,修改作业,保护作业免受系统宕机的影响并运行作业。   作业执行器:   作业执行器是一个守护进程,它真正地把作业放入执行队列。这一进程,pbs_mon,被非正式地命名为Mom,正如它是所有正在执行的作业的母亲(mother)一样。当Mom从一个服务器那里接收一个作业拷贝时就将它放入执行队列。Mom创建一个和用户登陆会话尽可能一致的新的会话。例如,如果用户的登陆shell是csh,那么Mom就创建一个会话,在此会话中.login和.cshrc一样运行。当服务器指示需要那么做时,Mom也负责把作业的输出返回给用户。   作业调度器:   作业调度器是另一个守护进程,这一进程包括site’ policy[1],这一策略控制着哪一个作业被运行,在那个节点运行,什么时候运行。因为每一个site对于什么是好的或者有效的策略都有它自己的想法,PBS允许每一个site来创建它自己的调度器。当运行的时候,调度器就可以和不同的Moms进行通信来获知系统资源的状态;和服务器进行通信来获知要执行的作业的有效性。与服务器之间的接口是通过和命令组件一样的API。实际上,调度器仅仅作为服务器的批处理管理器出现的。   除了上面主要的部分之外,PBS也提供了一个应用编程接口,API,命令组件用它来和服务器进行通信。这一API在和PBS一起完成的第三部分的man pages中描述。A site[1]如果愿意可以利用这些API来实现新的命令。