*基本上,我正在尝试按对象在过去一个小时内的得分来排序。
我正在尝试为我的数据库中的对象生成每小时的投票总和。投票被嵌入到每个对象中。对象模式如下所示:
{
_id: ObjectId
score: int
hourly-score: int <- need to update this value so I can order by it
recently-voted: boolean
votes: {
"4e4634821dff6f103c040000": { <- Key is __toString of voter ObjectId
"_id": ObjectId("4e4634821dff6f103c040000"), <- Voter ObjectId
"a": 1, <- Vote amount
"ca": ISODate("2011-08-16T00:01:34.975Z"), <- Created at MongoDate
"ts": 1313452894 <- Created at timestamp
},
... repeat ...
}
}
这个问题实际上与我几天前问的一个问题有关,在MongoDB中建模投票系统的最佳方法
我将如何(我可以吗?)运行MapReduce命令做以下事情:
- 只运行在最近投票= true或小时得分> 0的对象上。
- 计算最近一小时内创建的投票总数。
- 更新小时得分=上述计算的总和,最近投票= false。
我还在这里读到,我可以通过在M/R命令之前运行DB . getmongo (). setslaveok()在从数据库上执行MapReduce。我可以在从数据库上运行reduce并更新主数据库吗?
就地更新甚至可能与Mongo MapReduce?
您绝对可以这样做。我来逐一回答你们的问题:
1。您可以指定一个查询以及map-reduce,它过滤将传递到映射阶段的对象集。在mongo shell中,这看起来像(假设m
和r
分别是您的映射器和reducer函数的名称):
> db.coll.mapReduce(m, r, {query: {$or: [{"recently-voted": true}, {"hourly-score": {$gt: 0}}]}})
2。步骤#1将允许您在最近一小时内(或将recently-voted
设置为true)至少有一次投票的所有文档上使用映射器,但并非所有投票都是在最近一小时内进行的。因此,您需要在映射器中过滤列表,并只显示您希望计数的那些投票:
function m() {
var hour_ago = new Date() - 3600000;
this.votes.forEach(function (vote) {
if (vote.ts > hour_ago) {
emit(/* your key */, this.vote.a);
}
});
}
和减少:
function r(key, values) {
var sum = 0;
values.forEach(function(value) { sum += value; });
return sum;
}
3。要更新小时分数表,您可以使用reduceOutput
选项来map-reduce,它将使用发出的值和输出集合中先前保存的值(如果有的话)调用您的reducer。该传递的结果将保存到输出集合中。这看起来像:
> db.coll.mapReduce(m, r, {query: ..., out: {reduce: "output_coll"}})
除了重新减少输出之外,您还可以使用merge
,它将用新创建的文档覆盖输出集合中的文档(但保留_id
与您的m-r作业创建的_id
不同的任何文档),replace
,这实际上是一个删除并创建操作,是默认的,或者使用{inline: 1}
,它将结果直接返回给shell或您的驱动程序。注意,当使用{inline: 1}
时,您的结果必须适合单个文档的大小(在最近的MongoDB版本中为16MB)。
(4)。您可以在辅助服务器("从服务器")上运行map-reduce作业,但是由于辅助服务器不能接受写操作(这就是使它们成为辅助服务器的原因),因此您只能在使用内联输出时执行此操作。