PBS/torque常见错误

  1.  PBS_Server: Resource temporarily unavailable (11) in PBS_Server
    出错的原因一般是server_name与mom设置的name不一致,修改server_name与mom一致即可。 
    server_name文件在PBS或torque的目录下。如果用rpm包安装的torque, 可以用下面的命令查询
    rpm -ql torque
  2. qsub: Job exceeds queue resource limits MSG=cannot locate feasible nodes
    在提交作业时候,如果PBS没有计算节点,就会出现这个错误。也可以用
    pbsnodes
    
     来查看PBS的节点。如果没有任何输出结果,说明需要设置计算节点。编辑文件
    vim $PBS_HOME/server_priv/nodes
    
     加入类似的节点,如
    node001 np=2
    
     重启PBS服务。
  3.  mpiexec: cannot connect to local mpd
    原因是PBS脚本没有启动mpd。启动mpd的简单方法是
    cat $PBS_NODEFILE
    NCPU=`wc -l < $PBS_NODEFILE`
    NNODES=`uniq $PBS_NODEFILE | wc -l`
     
    mpdboot -n ${NNODES} -f ${PBS_NODEFILE} -v --remcons
    mpiexec -np $NCPU hostname
    mpdallexit
    
     
原文地址:https://www.cnblogs.com/liyropt/p/1860517.html