我想在lucene索引中添加pdf文件(可能我添加了)。现在我想通过lucene邻近搜索查询来提取特定的文本。
邻近搜索查询仅返回文件名。
But i want to extract all texts within the proximity query range.
示例案例:test.pdf:-->"示例文本A xxxxx B.Lucene是有史以来最棒的"
接近查询是:A B~5
我想提取:xxxxx
我该怎么做。。。。。。?
提前感谢您的帮助和提示。。。。。。。。。。。
问候,
SENTHIL SARAVANAN
索引文件时请添加
doc.add(new Field("contents", result, Field.Store.COMPRESS,
Field.Index.ANALYZED,
Field.TermVector.WITH_POSITIONS_OFFSETS));
这里的文档类型为org.apache.locene.document.document.
在搜索文件时,请使用com.java.search.HHighlighterUtil.getFragmentsWithHighlightedTerms(分析器分析器、查询查询、字符串字段名称、字符串字段内容、int fragmentNumber、int fractionSize)查找片段。