Lucene updateDocument speed



我正在通过Lucene并行索引。5k个文档,每个文档大约有。大小20kB,我需要通过updateDocument方法频繁更新它们。

我正在使用NRT,其中可能多达50个线程更新文档。在100次更新/插入或10分钟超时后,提交在单独的线程中完成。

到目前为止,每次文档更新的平均持续时间为1秒,最终峰值为80秒(需要分析具体文档)。

谁能告诉我应该使用什么策略/优化来加快文档更新?

我发现当应用程序请求最新的reader时,内存文档中的NRT会刷新,这从索引的角度来看是无益的。

切换到正常索引,并将刷新策略更改为按条目计数处理,而不是按内存处理,因为较大的文档会导致频繁的刷新。

最新更新