计算最常见的数组元素



我有一堆包含标签数组的文档:

{ tags: ["tag1", "tag2", "tag3"] }

我想做的是计算所有文档中使用的十大最常见标签。经过一番试验之后,我想出了以下解决方案:

r.db("database").table("table").concatMap(function(doc) {
  return doc("tags")
}).coerceTo("array").group(function(entry) {
  return entry
}).count().ungroup().orderBy(r.desc("reduction").limit(10).map(function(doc) {
  return doc("group")
})

但是,我"感觉到"(我对查询优化的知识有限),这是一种相当麻烦的方法。谁能通过正确使用索引提出更有效的方法?

除了 coerceTo('array')外,查询对我来说很好,我认为这是必要的,这可能会影响性能。您也可以缩短很多:

r.table('table').group('tags', {multi: true}).count().ungroup().orderBy('reduction').slice(-10)('group')

最新更新