我有一个python脚本,我通常从BASH shell执行,如下所示:
pychimera $(which dockprep.py) -rec receptor1.pdb -lig ligand1.mol -cmethod gas -neut
如您所见,一些参数需要输入(例如 -rec(,而其他参数则不需要(例如 -neut(。我必须使用不同的输入执行此脚本 154 次。如何使用 GNU 并行脚本并行运行 8 个线程?
pychimera $(which dockprep.py) -rec receptor1.pdb -lig ligand1.mol -cmethod gas -neut
pychimera $(which dockprep.py) -rec receptor2.pdb -lig ligand2.mol -cmethod gas -neut
pychimera $(which dockprep.py) -rec receptor3.pdb -lig ligand3.mol -cmethod gas -neut
...
我想你想要这个:
parallel 'pychimera $(which dockprep.py) -rec receptor{}.pdb -lig ligand{}.mol -cmethod gas -neut' ::: {1..154}
如果您有 8 个 CPU 内核以外的其他,并且特别希望一次有 8 个进程,请使用:
parallel -j8 ...
如果要查看将在不实际运行任何内容的情况下运行的命令,请使用:
parallel --dry-run ...
生成器
脚本commands.txt
示例:
#!/usr/bin/env bash
if [ "$#" -ne 1 ]; then
echo "missing parameter: n"
exit 1
fi
rm commands.txt 2> /dev/null
dockp=$(which dockprep.py)
for((i=1;i<=$1;i++)); do
echo "pychimera $dockp -rec receptor$i.pdb -lig ligand$i.mol -cmethod gas -neut" >> commands.txt
done
如果将上面的 bash 脚本另存为 cmdgen.sh
则可以按以下方式运行它:
bash cmdgen.sh 100
如果你需要n
是100。
并行运行命令:
$ module load parallel
$ parallel < commands.txt