从 SOLR 索引中删除空值



我目前正在将一些来自外部来源的文档索引到 SOLR 中。此外部源也很少有空元素在 SOLR 中被索引。如何避免在 SOLR 中索引空/空值。

例如

我的CSV是名称,城市,邮政编码。一些值是

Jack,Houston, 89812
,Austin,98123

在第二个值集中,我没有名字。但是,当 SOLR 索引此文档时,它会添加 {"名称":","城市":"奥斯汀","Zip":"98123"}。如何避免在 SOLR 中将"名称"作为空元素?

提前致谢

如果您需要在提交的文档进入模式之前对其进行任何预处理,Solr有一个完整的UpdateRequestProcessor子系统。您正在寻找的特定版本是RemoveBlankFieldUpdateProcessorFactory,可能与TrimFieldUpdateProcessorFactory结合使用。那里

请记住,您需要告诉Solr您想通过链(默认或显式(或通过单个配置(显式(使用它们,所有这些都在上面的第一个链接中描述。

您可以将 CSV 转换为 JSON,不提供空名称,然后为 JSON 文件编制索引。

Solr本身只索引它得到的东西。如果它索引一个空字段,它就会得到一个空字段。这就是 CSV 索引器发生的情况,我想,它只是不能省略空白字段。

使用JSON,您可以掌控一切。

最新更新