我的目标是从50-100个MS Word或PDF文档中创建一个JSON格式的文档文件。
有没有办法向"convert_document"命令提供多个文档?我尝试过使用curl提供多个.pdf或*.doc文件,如下所示:
curl -u
"username":"password"
-F "config={"conversion_target":"ANSWER_UNITS"};type=application/json"
-F "file=@*.doc;type=application/msword" -X POST
"https://gateway.watsonplatform.net/document-conversion-experimental/api/v1/convert_document"
不幸的是,这给了我一个错误:curl: (26) couldn't open file "*.doc"
我也尝试过-F "file=@file1.doc,file2.doc,file3.doc"
,但也会出现错误。
文档转换服务一次只接受一个文件,但您可以多次调用它并连接结果。
#!/bin/bash
USERNAME="<service-username>"
PASSWORD="<service-password>"
URL="https://gateway.watsonplatform.net/document-conversion-experimental/api/v1/convert_document"
DIRECTORY="/path/to/documents"
for doc in *.doc
do
echo "Converting - $doc"
curl -u "$USERNAME:$PASSWORD"
-F 'config={"conversion_target":"ANSWER_UNITS"};type=application/json'
-F "file=@$doc;type=application/pdf" "$URL"
done