MapReduce作业是否有任何方法可以从MongoDB辅助数据库中创建或删除集合



我有一个MapReduce作业,我只想在辅助作业上运行。MapReduce输出将创建一个临时集合来存储结果,我想从该集合中读取结果,然后删除该集合。

您不能在MongoDB辅助数据库上运行输出到集合中的MapReduce作业。您只能直接在MongoDB主数据库上插入/更新数据。

但是,可以使用out参数内联返回MapReduce输出,例如:

out: { inline: 1 }

请注意,内联输出被限制为最大文档大小(在MongoDB 2.4中为16兆字节)

上面的答案是准确的。仅提及附加信息:

  • Map Reduce(&聚合管道作业)必须是只读的(从数据库的角度来看)才能在Secondary上运行
  • 对于MR,需要通过设置outlineinline参数

示例(来源):

RS-replica-0:PRIMARY> db.txns.findOne()
{
    "_id" : ObjectId("584a3b71cdc1cb061957289b"),
    "custid" : "cust_66",
    "txnval" : 100,
    "items" : [{"sku": sku1", "qty": 1, "pr": 100}, ...],
...
}
RS-replica-0:PRIMARY> var mapFunc = function() { emit(this.custid, this.txnval); }
RS-replica-0:PRIMARY> var reduceFunc = function(key, values) { return Array.sum(values); }
RS-replica-0:PRIMARY> db.txns.mapReduce(mapFunc, reduceFunc, {out: { inline: 1 }})
{
    "results" : [
        {
            "_id" : "cust_0",
            "value" : 72734
        },
        {
            "_id" : "cust_1",
            "value" : 67737
        },
...
    ]
    "timeMillis" : 215,
    "counts" : {
        "input" : 10000,
        "emit" : 10000,
        "reduce" : 909,
        "output" : 101
    },
    "ok" : 1
}
  • 在分片集群的情况下,即使遵循了所有规则,MapReduce作业也不会在辅助上运行(Source)。这是一个已知的错误,请投票支持它,以便MongoDB的人有一天能修复它。:)

相关内容

  • 没有找到相关文章

最新更新