猫鼬按关联限制



我有这样的集合:

[
  { parent: 'a', d1: '1', d2: '2', d3: '3', w: 10 },
  { parent: 'a', d1: '1', d2: '2', d3: '3', w: 20 },
  { parent: 'a', d1: '1', d2: '2', d3: '3', w: 30 },
  { parent: 'a', d1: '1', d2: '2', d3: '3', w: 40 },
  { parent: 'a', d1: '1', d2: '2', d3: '3', w: 50 },
  { parent: 'a', d1: '1', d2: '2', d3: '3', w: 60 },
  { parent: 'b', d1: '1', d2: '2', d3: '3', w: 10 },
  { parent: 'b', d1: '1', d2: '2', d3: '3', w: 13 },
  { parent: 'b', d1: '1', d2: '2', d3: '3', w: 14 },
  { parent: 'b', d1: '1', d2: '2', d3: '3', w: 15 },
  { parent: 'c', d1: '1', d2: '2', d3: '3', w: 10 },
  { parent: 'c', d1: '1', d2: '2', d3: '3', w: 100 },
  { parent: 'c', d1: '1', d2: '2', d3: '3', w: 200 },
  { parent: 'c', d1: '1', d2: '2', d3: '3', w: 300 }
]

给定一个具有相关父 ID 的查询,['b','c'],我需要返回每个父级的前 3 个结果,希望按w DESC 排序:

[
  { parent: 'b', d1: '1', d2: '2', d3: '3', w: 15 },
  { parent: 'b', d1: '1', d2: '2', d3: '3', w: 14 },
  { parent: 'b', d1: '1', d2: '2', d3: '3', w: 13 },
  { parent: 'c', d1: '1', d2: '2', d3: '3', w: 300 },
  { parent: 'c', d1: '1', d2: '2', d3: '3', w: 200 },
  { parent: 'c', d1: '1', d2: '2', d3: '3', w: 100 }
]

使用 .find().limit() 将返回总体的前 N 个结果,而不是每个parent的前 N 个结果。使用 .aggregate() 我想出了如何按parent聚合,但我无法弄清楚如何按父级$limit,也无法将整个文档作为{parent: 'b', items: [{..}, {..}] }返回,而不仅仅是组数据。我可以得到我已经拥有的parent,或者parent和使用$push的某个字段上的数组,但这仍然不好。

最后我也尝试了.mapReduce但这似乎有点矫枉过正,我不必为聚合部分emit(this.project, this);吗? 我怎么会$limit呢? 用手?这是相当少据可查的。

无论如何,在这里走哪条路的方向会很棒。我正在使用mongoose@latest.

正如所指出的,不幸的是,这无法使用当前存在的MongoDB聚合框架来实现,正如您提到的,map-reduce将是矫枉过正。

但是还有其他方法:

方法A:

  • 维护一个变量,表示基于w的层次结构级别字段,或要作为结果集排序依据的字段。一次在插入过程中将变量添加到每个文档。
  • 您的文档将包含一个名为 level 的新字段,其中包含单个值的数组。我们将讨论,为什么这需要是一个数组,而不是一个简单的字段。

插入脚本:

db.collection.insert([
  { parent: 'a', d1: '1', d2: '2', d3: '3', w: 10,level:[6] },
  { parent: 'a', d1: '1', d2: '2', d3: '3', w: 20,level:[5] },
  { parent: 'a', d1: '1', d2: '2', d3: '3', w: 30,level:[4] },
  { parent: 'a', d1: '1', d2: '2', d3: '3', w: 40,level:[3] },
  { parent: 'a', d1: '1', d2: '2', d3: '3', w: 50,level:[2] },
  { parent: 'a', d1: '1', d2: '2', d3: '3', w: 60,level:[1] },
  { parent: 'b', d1: '1', d2: '2', d3: '3', w: 10,level:[4] },
  { parent: 'b', d1: '1', d2: '2', d3: '3', w: 13,level:[3] },
  { parent: 'b', d1: '1', d2: '2', d3: '3', w: 14,level:[2] },
  { parent: 'b', d1: '1', d2: '2', d3: '3', w: 15,level:[1] },
  { parent: 'c', d1: '1', d2: '2', d3: '3', w: 10,level:[4] },
  { parent: 'c', d1: '1', d2: '2', d3: '3', w: 100,level:[3] },
  { parent: 'c', d1: '1', d2: '2', d3: '3', w: 200,level:[2] },
  { parent: 'c', d1: '1', d2: '2', d3: '3', w: 300,level:[1] }
])

假设您希望根据每个父项的w字段的排序顺序获取前 3 个结果。您可以轻松聚合如下:

var levels = [1,2,3];  // indicating the records in the range that we need to pick up,
                       // from each parent. 
  • 匹配所有ab的父母。
  • w字段对记录进行排序。
  • parent分组。分组后,父级的所有文档成为分组记录的子文档,因此允许您应用$redact阶段。
  • 现在应用$redact阶段来编辑那些子文档,其级别不是我们所寻求的级别的子集。我们一直level一个数组,因为它可以更轻松地应用$setIsSubset操作员在上面。否则我们将需要$in,这不是在$cond表达式中受支持。

法典:

Model.aggregate(
{$match:{"parent":{$in:["a","b"]}}},
{$sort:{"w":-1}},
{$group:{"_id":"$parent",
         "rec":{$push:"$$ROOT"}}},
{$redact:{$cond:[{$setIsSubset:[{$ifNull:["$levels",[1]]},
                               inp]},
                 "$$DESCEND","$$PRUNE"]}},
,function(err,resp){
 // handle response
})

获得的输出是完美的,正如我们想要的那样:(只显示b组,以保持更短)

{
        "_id" : "b",
        "rec" : [
                {
                        "_id" : ObjectId("54b030a3e4eae97f395e5e89"),
                        "parent" : "b",
                        "d1" : "1",
                        "d2" : "2",
                        "d3" : "3",
                        "w" : 15,
                        "level" : [
                                1
                        ]
                },
                {
                        "_id" : ObjectId("54b030a3e4eae97f395e5e88"),
                        "parent" : "b",
                        "d1" : "1",
                        "d2" : "2",
                        "d3" : "3",
                        "w" : 14,
                        "level" : [
                                2
                        ]
                },
                {
                        "_id" : ObjectId("54b030a3e4eae97f395e5e87"),
                        "parent" : "b",
                        "d1" : "1",
                        "d2" : "2",
                        "d3" : "3",
                        "w" : 13,
                        "level" : [
                                3
                        ]
                }
        ]
}

方法B:

子文档的编校在客户端完成:

var result = db.collection.aggregate([
{$match:{"parent":{$in:["a","b"]}}},
{$sort:{"w":-1}},
{$group:{"_id":"$parent","rec":{$push:"$$ROOT"}}}
]).map(function(doc){
    doc.rec.splice(0,3);
    return doc;
})

这是相当慢的,因为每个父级的所有记录都将由 MongoDB 返回。选择权在您手中,具体取决于适合您的应用。

在阅读了类似问题的回答后,我决定沿着这条路走下去,我编写了一个模块,该模块以一定的灵活性为您构建聚合查询。

基于我最初问题的示例代码:

var _ = require('lodash');
var limited = require('limited');
var D = require('./models/D');
function getLastDsByParent (ids, done) {
  var options = {
    model: D,
    field: 'parent',
    query: { parent : { $in: ids } },
    limit: 3,
    sort: { w: -1 }
  };
  limited(options, find);
  function find (err, result) {
    if (err) {
      done(err); return;
    }
    D
      .find({ _id: { $in: _.flatten(result, 'documents') } })
      .lean()
      .exec(done);
  }
}

相关内容

  • 没有找到相关文章

最新更新