我有两个索引,一个是特定短语的列表,另一个是可能(或不包含)这些搜索短语的文档。
我的索引看起来如下:
短语
- 短语
文档
- 创造者
- 持久的
- DocumentText
对于阶段索引中的每个短语,我想在文档索引中的文档计数,其中documentText包含来自短语索引的短语。
,例如,如果将结果格式化为桌子,我期望这样的事情:
|短语|文件计数|| ------------- | ------------------------------ ||"短语1" |10 ||"短语2" |12 |
我可以在单个索引中使用术语聚合来执行此操作,但是无法弄清楚索引之间的可能性。
尽我所能近的距离,而弹性开箱即用。相反,我最终更新了每个文档以包括相关的短语。
为此,我编写了一个小型控制台应用程序,该应用程序遍布我的短语索引中的每个值并对该短语进行了搜索。然后,我遍历每个返回的文档,并将短语添加到"短语"属性中。
我可以根据该属性在集合上进行汇总查询。