有没有一种最佳的方法来识别目录中的无缺陷Lucene索引



刚刚掌握Lucene(目前使用4.6)。

Lucene索引由目录中的各种文件组成(最初大约为5个,但可能更少)。它们的名字很神秘,比如"_0.fdt"等。

我只是想知道是否有一种通用的方法来测试目录的内容,以确定它是否是一个未损坏的、因此可用的Lucene索引?也许最初假设v4.6是唯一可能需要处理的版本。。。

实际上,关键是,如果可以看到一个索引存在,并且确定它是最近创建或更新的,那么算法可能会确定可能没有必要重新创建索引。。。而如果它不可读/不可用,则必须将其完全删除并重建。

有人知道我在说什么吗?

CheckIndex包含许多工具,用于获取有关索引运行状况的信息,并修复段。该类也可以作为命令行工具运行,如果这比编写代码更方便的话。

当然,如果索引已损坏,尝试打开IndexWriter应该抛出CorruptIndexException。你可以直接处理这个异常。

最新更新