OpenMPI:SGE群集上的主机密钥验证失败



我最近在SGE集群上安装了OpenMPI 2.0版。但当我提交一份工作时,我得到了"主机ket验证失败"。尽管我可以在没有提交主机密码的情况下登录到该节点(compute10)。

输出文件中的错误:

警告:无法访问tty(错误的文件描述符)。因此没有作业控制在这个外壳中。美国东部时间2019年1月30日星期三15:58:53主机密钥验证失败。[文件orca_main/gtoint.cpp,第137行]:orca错误完成ORCA_GTOInt 中的终止

我的SGE脚本如下:

/bin/tcsh

$-qsge-queue@compute10

$-pe mpi 8

$-V

$-cwd

$-jy

$-l h_vmem=64G

日期

setenv OMP_NUM_THREADS 8

/home/user/orca_4_0_12_linux_x86-64_openmpi202/orca ccl3.inp>ccl3.out

日期

和我的并行环境mpi:

pe_name mpi

插槽999

user_lists NONE

xuser_lists NONE

start_proc_args/export/sge6.2_U7/mpi/startmpi.sh-catch_rsh$pe_hostfile

stop_proc_args/export/sge6.2_U7/mpi/stoppi.sh

分配规则$pe_slots

control_slaves TRUE

job_is_first_task FALSE

urgency_slots最小

accounting_summary TRUE

在尝试了各种方法后,将OpenMPI更新到3.1.0版本并使用以下选项构建解决了问题。

/使用sge配置--prefix=/usr/local--默认情况下启用ortrun前缀

最新更新