我有将近10000个XML(小)文件,我正在通过MLCP将它们放入MarkLogic中。在摄取的时候,我正在进行一些转换,转换下的主要内容是字典更新。我正在从XML elemens的输入更新Dictionary。
我收到了警告。这个警告的含义和原因是什么?
WARN mapreduce.ContentWriter: XDMP-XDQPNOSESSION
MLCP接收文档的速度非常慢。我想是因为字典更新了。有没有任何方法可以增强MLCPjava堆内存,或者任何其他方法可以在ML服务器上快速获取这些文档。
请提出建议。
XDMP-XDQPNOSESSION的文档提到了一个影响MarkLogic 5.0-2及之前版本和4.2-9及之前版本的错误。如果你使用的是其中一个版本,那么修复方法似乎是升级超过它们。
您提到了基于XML元素更新Dictionary。MLCP在并行化输入方面做得很好,但对于每个输入文档,您都会在Dictionary文档上获取一个写锁。不确定你想用词典完成什么,但也许你可以用一个单词词典来代替。它将在插入文档时自动更新,而不需要对单个文件进行写锁定。