我有一个csv文件,其格式如下:
company_id | 年份 | 销售 | >购买>||||||
---|---|---|---|---|---|---|---|---|
3 | 2020 | 303 | 2019 | >td style="text align:right;">2342020年 | 443 | 351美国 | ||
2019 | 224 | 56美国
在摄取管道级别,您一次只能处理一个文档(即一行(,因此为了按照您想要的方式进行聚合,您需要在Logstash级别使用aggregate
过滤器。
如果行按位置正确排序,则可以使用官方文档中的以下示例。
不过,有一点需要注意:如果您将year
添加为字段,随着时间的推移,您的映射将不断增长,您可能面临映射爆炸的风险。