如何根据已保存搜索中的日期字段显示到期、逾期和未到期

例如，我在索引中有一个日期字段delivery_datetime，我必须向用户显示特定包裹是今天到期还是逾期或未到期

我不能创建一个单独的字段并重新索引，因为它基于当前日期，而且每天都在变化，例如，如果我必须在索引时进行计算，我必须每天重新索引，这是不可行的，因为我有很多数据。

我可能使用逐查询更新，但我的索引经常通过Python脚本更新，因为我们这里没有ACID属性，所以我们会有版本冲突。

据我所知，我认为我唯一的选择是使用脚本字段。

如果我必须用伪代码写逻辑：

Due - delivery_datetime.dateOnly == now.dateOnly
Over Due - delivery_datetime.dateOnly < now.dateOnly
Not Due - delivery_datetime.dateOnly > now.dateOnly

我想我有很多数据，如果我生成CSV，我不希望脚本字段对集群性能产生重大影响。

所以我需要一些帮助来有效地在脚本领域做到这一点，或者如果有任何完全不同的解决方案也会非常有帮助。

如果Scripted Field是唯一的解决方案，则希望通过提供无痛脚本来获得帮助。

一旦我们排除了文档更新，基本上有两种方法：script_fields或filter aggregations。

让我们首先假设您的映射看起来类似于：

{
"mappings": {
"properties": {
"delivery_datetime": {
"type": "object",
"properties": {
"dateOnly": {
"type": "date",
"format": "dd.MM.yyyy"
}
}
}
}
}
}

现在，如果我们通过它的ID来过滤所有的包，并想知道它处于哪个到期状态，我们可以创建3个脚本字段，如下所示：

GET parcels/_search
{
"_source": "timeframe_*",
"script_fields": {
"timeframe_due": {
"script": {
"source": "doc['delivery_datetime.dateOnly'].value.dayOfMonth == params.nowDayOfMonth",
"params": {
"nowDayOfMonth": 8
}
}
},
"timeframe_overdue": {
"script": {
"source": "doc['delivery_datetime.dateOnly'].value.dayOfMonth < params.nowDayOfMonth",
"params": {
"nowDayOfMonth": 8
}
}
},
"timeframe_not_due": {
"script": {
"source": "doc['delivery_datetime.dateOnly'].value.dayOfMonth > params.nowDayOfMonth",
"params": {
"nowDayOfMonth": 8
}
}
}
}
}

它会返回一些类似的东西

...
"fields" : {
"timeframe_due" : [
true
],
"timeframe_not_due" : [
false
],
"timeframe_overdue" : [
false
]
}

这很琐碎，日期数学有一个显著的弱点，下面将讨论

或者，我们可以使用3个过滤聚合，类似地只过滤出一个有问题的文档，如下所示：

GET parcels/_search
{
"size": 0,
"query": {
"ids": {
"values": [
"my_id_thats_due_today"
]
}
},
"aggs": {
"due": {
"filter": {
"range": {
"delivery_datetime.dateOnly": {
"gte": "now/d",
"lte": "now/d"
}
}
}
},
"overdue": {
"filter": {
"range": {
"delivery_datetime.dateOnly": {
"lt": "now/d"
}
}
}
},
"not_due": {
"filter": {
"range": {
"delivery_datetime.dateOnly": {
"gt": "now/d"
}
}
}
}
}
}

产生

...
"aggregations" : {
"overdue" : {
"doc_count" : 0
},
"due" : {
"doc_count" : 1
},
"not_due" : {
"doc_count" : 0
}
}

现在第二种方法的优点如下：

没有涉及脚本->更快的执行。
更重要的是，你不必担心像12月15日这样的月日数学会晚于11月20日，但琐碎的月日比较会产生其他结果。您可以在脚本中实现类似的东西，但复杂性越高，执行速度就越差。
您可以放弃ID筛选，在内部仪表板中使用这些聚合计数。甚至可能是一个客户仪表盘，但老客户很少有大量的包裹，这些包裹可以合理地汇总。

在回答我自己的问题时，以下是对我有效的方法。

脚本化字段脚本：

def DiffMillis = 0;
if(!doc['delivery_datetime'].empty) {
// Converting each to days, 1000*60*60*24 = 86400000
DiffMillis = (new Date().getTime() / 86400000) - (doc['delivery_datetime'].value.getMillis() / 86400000);
}
doc['delivery_datetime'].empty ? "No Due Date": (DiffMillis==0?"Due": (DiffMillis>0?"Over Due":"Not Due") )

我特别使用了三元运算符，因为如果我使用if else，那么我必须使用return，如果我使用了return，那么在为脚本字段添加筛选器时，我将面对search_phase_execution_exception。

相关内容

最新更新

热门标签：