我有脚本run_md.py
,它从名为test.pdb
的输入文件生成文件test.dcd
。我想使用GNU并行对远程服务器上的多个输入文件(test*.pdb
)执行相同的命令,并将结果传输回本地计算机。因此,我使用以下命令:
parallel --trc {.}.dcd -j 2 -S $SERVER1 './run_md.py {} 1000' ::: test*.pdb
命令在使用2个插槽的服务器上按预期运行。但是,文件没有传输回来,我得到以下错误:
rsync: link_stat "/home/bougui/{.}.dcd" failed: No such file or directory (2)
rsync error: some files/attrs were not transferred (see previous errors) (code 23) at main.c(1655) [Receiver=3.1.1]
看起来替换字符串不工作。我怎样才能使它起作用?
以下是parallel --version
的输出:
GNU parallel 20130922
Copyright (C) 2007,2008,2009,2010,2011,2012,2013 Ole Tange and Free Software Foundation, Inc.
License GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html>
This is free software: you are free to change and redistribute it.
GNU parallel comes with no warranty.
Web site: http://www.gnu.org/software/parallel
When using GNU Parallel for a publication please cite:
O. Tange (2011): GNU Parallel - The Command-Line Power Tool,
;login: The USENIX Magazine, February 2011:42-47.
你所做的是100%正确的。所以你体内的某些东西破坏了这个。
man parallel
的报告错误。该线程中报告的错误已经修复,该特性在最新版本的GNU parallel(20160622)中工作良好。与Debian 8.5打包的GNU并行版本20130922在使用{.}
字符串替换时存在错误,如下所述:
通过更多的测试,我发现必须在并行运行的命令中使用替换字符串指定输出文件。
出于测试目的,您可以在下面找到其他人可以运行的完整示例:
echo This is input_file > input_file && parallel --trc {}.out -S $SERVER1 cat {} ">"{}.out ::: input_file
上面的例子运行良好。当我使用替换字符串{.}
时,如下所示:
echo This is input_file > input_file.in && parallel --trc {.}.out -S $SERVER1 cat {} ">"{.}.out ::: input_file
同样有效。但是,如果我没有在并行运行的命令中指定{.}.out
,如下所示:
echo This is input_file > input_file.in && parallel --trc {.}.out -S $SERVER1 cat {} ">"input_file.out ::: input_file
…我重现了错误:
rsync: link_stat "/home/bouvier/{.}.out" failed: No such file or directory (2)
rsync error: some files/attrs were not transferred (see previous errors) (code 23) at main.c(1655) [Receiver=3.1.1]
rsync: [Receiver] write error: Broken pipe (32)
因此,输出文件必须在并行运行的命令中指定。