用于导出二进制文件的 MLCP 命令选项



我想将存储在 MarkLogic 中的二进制 (PPTX( 文件导出到我的本地文件系统。是否可以通过MLCP EXPORT导出存储在URI中的文档?

有数百万个文档存储在同一个目录中 - 因此MLCP EXPORT-directory_filter选项是没有用的。导出操作开始并出错,并显示"实例化结果项 141931 的请求异常:超出时间限制"。

这是我的选项文件

-host
marklogic-dev-server
-port
9014
-username
pk
-password
pk
-directory_filter
/openxml2/
#-query_filter
#doc("/openxml2/doc-uri.pptx")
-output_type
archive
-output_file_path
/Users/pk/marklogic/
-compress
true````

默认情况下,MLCP将以原始格式导出文档:

使用 mlcp 导出命令导出原始文档格式化为本机文件系统或 HDFS 上的文件。例如,您可以 将 XML 文档导出为包含 XML 的文本文件或二进制文件 文档作为 JPG 图像。

使用 mlcp export 命令将原始格式的文档导出为本机文件系统或 HDFS 上的文件。例如,可以将 XML 文档导出为包含 XML 的文本文件,或将二进制文档导出为 JPG 图像。 有许多不同的方法可以限制 MCLP 导出的文档。 您应该能够使用-query_filter-query_options或 -document_selector 来选择文件本身。

或者,您可以将文档添加到新集合中,并使用-collection_filter。 这对于少量文档是可以的,但对于较大的文档集则不建议这样做,因为将集合添加到大量文档可能会占用大量资源。

相关内容

  • 没有找到相关文章

最新更新