如何编写弹性搜索的摄取管道,以将csv文件加载为嵌套的JSON



我有一个csv文件,其格式如下:

>购买>30>td style="text align:right;">23456美国
company_id 年份 销售
3 2020320192020年443351美国
2019 224

在摄取管道级别,您一次只能处理一个文档(即一行(,因此为了按照您想要的方式进行聚合,您需要在Logstash级别使用aggregate过滤器。

如果行按位置正确排序,则可以使用官方文档中的以下示例。

不过,有一点需要注意:如果您将year添加为字段,随着时间的推移,您的映射将不断增长,您可能面临映射爆炸的风险。

最新更新