我需要在Cray XC MPP机器上编译VASP 5.3.5。该系统提供Gnu、Intel和Cray编译环境。BLAS、LAPACK、ScaLAPCK也可以选择"英特尔MKL"或Cray LibSci。
哪一个是最好的编译器,最好的数值库和Makefile选项?
对ARCHER的测试(http://www.archer.ac.uk)已经表明,在Cray XC30系统上,将"英特尔编译器"与"英特尔MKL"one_answers"FFTW"结合使用,可以产生VASP 5.3.5的最佳性能和最稳定的内部版本。
完整的编译说明可在以下网址找到:
http://www.archer.ac.uk/documentation/software/vasp/compiling_5-3-5-phase2.php
简而言之,程序是:
module swap PrgEnv-cray PrgEnv-intel
module load fftw
module load cray-pe-hugepages2M
修改库makefile以具有以下选项:
CPP = gcc -E -P -C $*.F >$*.f
FC=ftn
CFLAGS = -O3
FFLAGS = -O3 -unroll -ip -no-prec-div -xAVX
FREE = -free
构建库(假设makefile被称为"makefile.cray_xc_intel.lib"):
cd vasp.5.lib
make -f makefile.cray_xc_intel.lib
移动到主源代码目录:
cd ../vasp.5.3
在Makefile中设置预处理器选项(这适用于多个K点版本):
CPP = $(CPP_) -DMPI -DHOST="CrayXC-Intel"
-DNGZhalf
-DLONGCHAR
-Dkind8
-DCACHE_SIZE=2000
-Davoidalloc
-DRPROMU_DGEMV
-DMPI_BLOCK=100000
-Duse_collective
-Drandom_array
-DscaLAPACK
设置makefile编译选项:
FC=ftn
FCL=$(FC)
CPP_ = ./preprocess <$*.F | cpp -P -C -traditional >$*$(SUFFIX)
FFLAGS = -free -march=corei7-avx -assume byterecl -m64
OFLAG = -O3 -ip -fno-alias -unroll-aggressive -opt-prefetch -use-intel-optimized-headers -no-prec-div
OFLAG_LOW = -O1 -g -ftz
OBJ_LOW = broydon.o
为"英特尔MKL:"设置makefile线性代数库选项
MKL_PATH = $(MKLROOT)/lib/intel64
BLAS=
LAPACK=
BLACS=
SCA=
LIB = ../vasp.5.lib/linpack_double.o -L../vasp.5.lib -ldmy
${MKL_PATH}/libmkl_blas95_lp64.a ${MKL_PATH}/libmkl_lapack95_lp64.a
${MKL_PATH}/libmkl_scalapack_lp64.a
-Wl,--start-group ${MKL_PATH}/libmkl_intel_lp64.a
${MKL_PATH}/libmkl_sequential.a ${MKL_PATH}/libmkl_core.a
${MKL_PATH}/libmkl_blacs_intelmpi_lp64.a -Wl,--end-group -lpthread -lm
最后,设置链接FFTW:的makefile选项
FFT3D = fftmpiw.o fftmpi_map.o fftw3d.o fft3dlib.o
现在构建代码(假设makefile被称为"makefile.cray_xc_intel"):
make -f makefile.cray_xc_intel