MongoDB MapReduce更新到位如何



*基本上,我正在尝试按对象在过去一个小时内的得分来排序。

我正在尝试为我的数据库中的对象生成每小时的投票总和。投票被嵌入到每个对象中。对象模式如下所示:

{
    _id: ObjectId
    score: int
    hourly-score: int <- need to update this value so I can order by it
    recently-voted: boolean
    votes: {
        "4e4634821dff6f103c040000": { <- Key is __toString of voter ObjectId
            "_id": ObjectId("4e4634821dff6f103c040000"), <- Voter ObjectId
            "a": 1, <- Vote amount
            "ca": ISODate("2011-08-16T00:01:34.975Z"), <- Created at MongoDate
            "ts": 1313452894 <- Created at timestamp
        },
        ... repeat ...
    }
}

这个问题实际上与我几天前问的一个问题有关,在MongoDB中建模投票系统的最佳方法

我将如何(我可以吗?)运行MapReduce命令做以下事情:

  1. 只运行在最近投票= true或小时得分> 0的对象上。
  2. 计算最近一小时内创建的投票总数。
  3. 更新小时得分=上述计算的总和,最近投票= false。

我还在这里读到,我可以通过在M/R命令之前运行DB . getmongo (). setslaveok()在从数据库上执行MapReduce。我可以在从数据库上运行reduce并更新主数据库吗?

就地更新甚至可能与Mongo MapReduce?

您绝对可以这样做。我来逐一回答你们的问题:

1。您可以指定一个查询以及map-reduce,它过滤将传递到映射阶段的对象集。在mongo shell中,这看起来像(假设mr分别是您的映射器和reducer函数的名称):

> db.coll.mapReduce(m, r, {query: {$or: [{"recently-voted": true}, {"hourly-score": {$gt: 0}}]}})

2。步骤#1将允许您在最近一小时内(或将recently-voted设置为true)至少有一次投票的所有文档上使用映射器,但并非所有投票都是在最近一小时内进行的。因此,您需要在映射器中过滤列表,并只显示您希望计数的那些投票:

function m() {
  var hour_ago = new Date() - 3600000;
  this.votes.forEach(function (vote) {
    if (vote.ts > hour_ago) {
      emit(/* your key */, this.vote.a);
    }
  });
}

和减少:

function r(key, values) {
  var sum = 0;
  values.forEach(function(value) { sum += value; });
  return sum;
}

3。要更新小时分数表,您可以使用reduceOutput选项来map-reduce,它将使用发出的值和输出集合中先前保存的值(如果有的话)调用您的reducer。该传递的结果将保存到输出集合中。这看起来像:

> db.coll.mapReduce(m, r, {query: ..., out: {reduce: "output_coll"}})

除了重新减少输出之外,您还可以使用merge,它将用新创建的文档覆盖输出集合中的文档(但保留_id与您的m-r作业创建的_id不同的任何文档),replace,这实际上是一个删除并创建操作,是默认的,或者使用{inline: 1},它将结果直接返回给shell或您的驱动程序。注意,当使用{inline: 1}时,您的结果必须适合单个文档的大小(在最近的MongoDB版本中为16MB)。

(4)。您可以在辅助服务器("从服务器")上运行map-reduce作业,但是由于辅助服务器不能接受写操作(这就是使它们成为辅助服务器的原因),因此您只能在使用内联输出时执行此操作。

相关内容

  • 没有找到相关文章

最新更新