我有一个MapReduce作业,我只想在辅助作业上运行。MapReduce输出将创建一个临时集合来存储结果,我想从该集合中读取结果,然后删除该集合。
您不能在MongoDB辅助数据库上运行输出到集合中的MapReduce作业。您只能直接在MongoDB主数据库上插入/更新数据。
但是,可以使用out
参数内联返回MapReduce
输出,例如:
out: { inline: 1 }
请注意,内联输出被限制为最大文档大小(在MongoDB 2.4中为16兆字节)
上面的答案是准确的。仅提及附加信息:
- Map Reduce(&聚合管道作业)必须是只读的(从数据库的角度来看)才能在Secondary上运行
- 对于MR,需要通过设置
outline
的inline
参数
示例(来源):
RS-replica-0:PRIMARY> db.txns.findOne()
{
"_id" : ObjectId("584a3b71cdc1cb061957289b"),
"custid" : "cust_66",
"txnval" : 100,
"items" : [{"sku": sku1", "qty": 1, "pr": 100}, ...],
...
}
RS-replica-0:PRIMARY> var mapFunc = function() { emit(this.custid, this.txnval); }
RS-replica-0:PRIMARY> var reduceFunc = function(key, values) { return Array.sum(values); }
RS-replica-0:PRIMARY> db.txns.mapReduce(mapFunc, reduceFunc, {out: { inline: 1 }})
{
"results" : [
{
"_id" : "cust_0",
"value" : 72734
},
{
"_id" : "cust_1",
"value" : 67737
},
...
]
"timeMillis" : 215,
"counts" : {
"input" : 10000,
"emit" : 10000,
"reduce" : 909,
"output" : 101
},
"ok" : 1
}
- 在分片集群的情况下,即使遵循了所有规则,MapReduce作业也不会在辅助上运行(Source)。这是一个已知的错误,请投票支持它,以便MongoDB的人有一天能修复它。:)