我最近在SGE集群上安装了OpenMPI 2.0版。但当我提交一份工作时,我得到了"主机ket验证失败"。尽管我可以在没有提交主机密码的情况下登录到该节点(compute10)。
输出文件中的错误:
警告:无法访问tty(错误的文件描述符)。因此没有作业控制在这个外壳中。美国东部时间2019年1月30日星期三15:58:53主机密钥验证失败。[文件orca_main/gtoint.cpp,第137行]:orca错误完成ORCA_GTOInt 中的终止
我的SGE脚本如下:
/bin/tcsh
$-qsge-queue@compute10
$-pe mpi 8
$-V
$-cwd
$-jy
$-l h_vmem=64G
日期
setenv OMP_NUM_THREADS 8
/home/user/orca_4_0_12_linux_x86-64_openmpi202/orca ccl3.inp>ccl3.out
日期
和我的并行环境mpi:
pe_name mpi
插槽999
user_lists NONE
xuser_lists NONE
start_proc_args/export/sge6.2_U7/mpi/startmpi.sh-catch_rsh$pe_hostfile
stop_proc_args/export/sge6.2_U7/mpi/stoppi.sh
分配规则$pe_slots
control_slaves TRUE
job_is_first_task FALSE
urgency_slots最小
accounting_summary TRUE
在尝试了各种方法后,将OpenMPI更新到3.1.0版本并使用以下选项构建解决了问题。
/使用sge配置--prefix=/usr/local--默认情况下启用ortrun前缀