PBS 作业调度应用

PBS(Portable Batch System),最初由 NASA 的 Ames 研究中心开发,主要为了提供一个能满足异构计算网络需要的软件包,用于灵活的批处理(Portable Batch Process),特别是满足高性能计算的需要,如集群系统、超级计算机和大规模并行系统。

特别是满足高性能计算(HPC)的需要,如集群系统、超级计算机和大规模并行系统

PBS 的主要特点有:代码开放,免费获取;支持批处理、交互式作业和串行、多种并行作业,如 MPI、 PVM、HPF、MPL;PBS 是功能最为齐全, 历史最悠久, 支持最广泛的本地集群调度器之一。

PBS 的目前包括以下三个主要分支:

  • openPBS,
    • OpenPBS 是最早的 PBS 系统,目前已经没有太多后续开发,
  • PBS Pro
    • PBS pro 是 PBS 的商业版本,功能最为丰富
  • Torque,
    • Torque是 Clustering 公司接过了 OpenPBS,并给与后续支持的一个开源版本。

1. 运行

PBS的应用不同于一般的直接运行:mpirun –np number ./executable_file

直接运行上句,则只能在单个节点上进行并行计算。如果要在多个节点上并行执行则要写 machinefile 或 p4pgfile,两种文件的具体写法参考张林波等《并行计算导论》。运行命令分别为:

  • mpirun –machinefile filename
  • mpirun –p4pg filename

应用 PBS 提交任务则会形成任务队列,依次执行,有效分配资源,避免资源竞争。否则 CPU 时间片会轮流分配给各个人的任务,从而影响所有人的正常作业。


PBS作业调度应用与说明

原文地址:https://www.cnblogs.com/mtcnn/p/9423026.html