如何从Lucene索引中提取特定文本



我想在lucene索引中添加pdf文件(可能我添加了)。现在我想通过lucene邻近搜索查询来提取特定的文本。

邻近搜索查询仅返回文件名。

But i want to extract all texts within the proximity query range.

示例案例:test.pdf:-->"示例文本A xxxxx B.Lucene是有史以来最棒的"

接近查询是:A B~5

我想提取:xxxxx

我该怎么做。。。。。。?

提前感谢您的帮助和提示。。。。。。。。。。。

问候,

SENTHIL SARAVANAN

索引文件时请添加

            doc.add(new Field("contents", result, Field.Store.COMPRESS,
                        Field.Index.ANALYZED,
                        Field.TermVector.WITH_POSITIONS_OFFSETS));

这里的文档类型为org.apache.locene.document.document.

在搜索文件时,请使用com.java.search.HHighlighterUtil.getFragmentsWithHighlightedTerms(分析器分析器、查询查询、字符串字段名称、字符串字段内容、int fragmentNumber、int fractionSize)查找片段。

相关内容

  • 没有找到相关文章

最新更新