我正在研究Lucene库,我在执行BooleanQuery后找到了所需的文档。我循环搜索器,每次我想将文档放入哈希图中。
int docId = hits[i].doc;
Document doc = searcher.doc(docId);
HashMap X = new HashMap ();
现在我想知道如何用文档的name_Field和value_Field填充哈希图 X?
您可以像这样迭代文档字段:
for (IndexableField field : doc.getFields())
{
X.put(field.name(), field.stringValue());
}
但它仅适用于存储在索引中的字段(那些使用 Field.Store.YES 标志添加的字段)。此外,如果文档中的字段有多个值,则必须修改此代码。
您可以扩展 lucene 收集器,然后根据需要添加文档。
IndexSearcher searcher = new IndexSearcher(indexReader);
private Map<String, String> docs = new HashMap<String, String>();
searcher.search(query, new Collector() {
private int docBase;
// ignore scorer
public void setScorer(Scorer scorer) {
}
// accept docs out of order (for a BitSet it doesn't matter)
public boolean acceptsDocsOutOfOrder() {
return true;
}
public void collect(int docNum) {
Document luceneDoc = searcher.doc(doc + docBase);
docs.put(luceneDoc.getValues(name_Field), luceneDoc.getValues(value_Field));
}
public void setNextReader(AtomicReaderContext context) {
this.docBase = context.docBase;
}
});