我正在将文档转换为内存中的pdf(unoconv)并在终端中打印(pdftotext):
unoconv -f pdf --stdout sample.doc | pdftotext -layout -enc UTF-8 - out.txt
正在工作。现在我想将此命令与child_process.spawn
一起使用:
let filePath = "...",
process = child_process.spawn("unoconv", [
"-f",
"pdf",
"--stdout",
filePath,
"|",
"pdftotext",
"-layout",
"-enc",
"UTF-8",
"-",
"-"
]);
在这种情况下,只有第一个命令(在 |之前)有效。我可以做我正在尝试的事情吗?
谢谢。
更新-
结果:sh -c- ....
bash-3.2$ sh -c- unoconv -f pdf --stdout /Users/fatimaalves/DEV/xx/_input/sample.doc | pdftotext -layout -enc UTF-8 - -
sh: --: invalid option
Usage: sh [GNU long option] [option] ...
sh [GNU long option] [option] script-file ...
GNU long options:
--debug
--debugger
--dump-po-strings
--dump-strings
--help
--init-file
--login
--noediting
--noprofile
--norc
--posix
--protected
--rcfile
--restricted
--verbose
--version
--wordexp
Shell options:
-irsD or -c command or -O shopt_option (invocation only)
-abefhkmnptuvxBCHP or -o option
Syntax Warning: May not be a PDF file (continuing anyway)
Syntax Error: Couldn't find trailer dictionary
Syntax Error: Couldn't find trailer dictionary
Syntax Error: Couldn't read xref table
从管道开始的所有内容都不是unoconv
的参数。它由外壳处理,而不是由unoconv
处理。因此,您不能将其作为参数数组的一部分传递 unoconv
.
需要,有许多方法可以解决此问题。如果您知道您将仅在类 UNIX 操作系统上运行,您可以将您的命令作为参数传递给 sh
:
process = child_process.spawn('sh', ['-c', 'unoconv -f pdf --stdout sample.doc | pdftotext -layout -enc UTF-8 - out.txt']);
如果您不想使用上述 sh
命令,则必须创建多个 child_process.spawn 实例,然后像这样将它们相互连接:
const getModule = spawn('curl', [url, '-ks']);
const unTar = spawn('tar', ['-xvz', '-C', fileName, '--strip-components', 1]);
getModule.stdout.pipe(unTar.stdin);
上面的代码理论上会从url
中检索一个tar,并解压缩到一个目录fileName