我有一个下面的格式,它有重复的ID字段。
ID PDE_ID Curency
1 21 USD 35
1 23 USD 34
2 25 CAD 43
3 26 INR 33
当有重复的ID字段时,我们需要按PDE_ID列选择最新的记录,结果我们需要进行聚合,如Sum、Min、Max、value_count。
我尝试了top_result和max,但两者都不支持子聚合。所以我可以做不同的和最新的记录,但不能在上面做任何聚合(sum/min/max/count(
非常感谢您的帮助。
无论谁被卡住,请找到以下查询:
GET dispute-1-2022-04-*/_search?size=0
{
"aggs": {
"Duplicates": {
"terms": {
"field": "PDE.keyword"
},
"aggs": {
"div_id": {
"terms": {
"field": "PDE_DETAIL_ID.keyword",
"order": {
"_term": "desc"
},
"size": 1
},
"aggs": {
"individual_sum": {
"sum": {
"field": "DIV_ID"
}
}
}
},
"max_cal": {
"max_bucket": {
"buckets_path": "div_id>individual_sum"
}
}
}
},
"total_min": {
"max_bucket": {
"buckets_path": "Duplicates>max_cal"
}
}
}
}