如何导入MarkLogic一个文件多个文档与内容泵



我有一个格式正确的单个json文件,它是一个文档数组(大约60,000)。我可以使用节点 API 导入它,但只是想知道如何使用 Marklogic 内容泵(窗口)导入此文件。

我尝试使用基本选项,它只创建了一个名为orders.json的文档

对于 MLCP,格式正确的 JSON 聚合(称为行分隔的 JSON)文件不是对象数组。它是一个文件,每行有一个字符串化对象。想想CSV,但JSON的东西。

想象一下,如果您传递了一个数组 - MLCP 进程必须将整个文件解析为 JSON 数组进行处理。每行一个对象意味着 MLCP 可以轻松地对文件进行分片并并行处理。事实上,如果您使用自动 URI,我认为它甚至不会解析为 JSON。

坏:

[
  {
    "bar": "baz"
  },
  {
    "bar": "buz"
  }
]

好:

{"bar":"baz"}
{"bar":"buz"}

关于这个的所有好东西都可以在这里找到:
MLCP 用户指南

相关部分是:(文档版本准确:"9.0-3,2017 年 9 月")

  • 4.10
  • 4.10.1

相关内容

  • 没有找到相关文章

最新更新