在 solr 索引中存储和导出原始令牌



我想存储 Solr 在索引期间生成的令牌,例如 DictionaryCompoundWordToken 然后导出它们,希望使用 CSVResponseWriter . 有没有办法做到这一点?

我知道可以使用分析工具提供值并查看它们是如何标记化的,但我不知道如何对整个索引执行此操作,或者至少在查询的基础上执行此操作。

让我们看看,我认为您想要的是将字段值与某个字段的原始内容一起存储,但在它经过一些分析链之后,对吧?

您可能会认为 copyFields 会有所帮助,但它们不会像您存储它们一样存储原始字段值。您需要使用更新处理器。看看Erik Hatcher的这个演讲,分钟7:30到20:00,你会看到这个案例解释得很好,有例子和所有。

一旦你把它存储在索引中,你就可以返回它并做任何你喜欢的事情。

查看

此目的的一种方法是,您将文档内容与DictionaryCompoundWordToken或任何其他符合您需求的分析一起索引到字段"mytext"中。然后你可以用q=*:*在"mytext"上进行分面,你的查询看起来像这样: http://localhost:8983/solr/collection1/select?q=*%3A*&start=0&rows=1&wt=xml&indent=true&facet=true&facet.field=mytext 这应该给出进入mytext的所有标记。 但我不能 100% 确定您对问题中所说的期望。让我知道这有帮助。

最新更新