>我正在寻找一种获取此类数据的方法
{ "_id" : 5, "count" : 1, "arr" : [ "aga", "dd", "a" ] },
{ "_id" : 6, "count" : 4, "arr" : [ "aga", "ysdf" ] },
{ "_id" : 7, "count" : 4, "arr" : [ "sad", "aga" ] }
我想根据 arr 的第 1 项(索引)对计数求和。在另一个聚合中,我想对 arr 数组中的第 1 项和第 2 项执行相同的操作。
我尝试使用展开,但这会分解数据,然后层次结构丢失。
我也尝试过使用
$group: {
_id: {
arr_0:'$arr.0'
},
total:{
$sum: '$count'
}
}
但结果是空白数组
您不能使用点表示法按指定索引处的元素对文档进行分组。对于两个,您有两个选择:
首先,最佳方法是使用 MongoDB 3.2 中新增的 $arrayElemAt
运算符,该运算符返回数组中指定索引处的元素。
db.collection.aggregate([
{ "$group": {
"_id": { "$arrayElemAt": [ "$arr", 0 ] },
"count": { "$sum": 1 }
}}
])
从MongoDB 3.0版本向后,您需要对数组进行非规范化,然后在第一次通过_id
$group
并使用$first
运算符返回数组中的第一项。从那里,您需要使用该值对文档进行重新分组,并使用$sum
来获取总和。但这仅适用于第一个和最后一个索引,因为MongoDB还提供了$last
运算符。
db.collection.aggregate([
{ "$unwind": "$arr" },
{ "$group": {
"_id": "$_id",
"arr": { "$first": "$arr" }
}},
{ "$group": {
"_id": "$arr",
"count": { "$sum": 1 }
}}
])
这会产生这样的东西:
{ "_id" : "sad", "count" : 1 }
{ "_id" : "aga", "count" : 2 }
要使用数组中位置p
的元素进行分组,您将有更好的机会使用 mapReduce
函数。
var mapFunction = function(){ emit(this.arr[0], 1); };
var reduceFunction = function(key, value) { return Array.sum(value); };
db.collection.mapReduce(mapFunction, reduceFunction, { "out": { "inline": 1 } } )
其中返回:
{
"results" : [
{
"_id" : "aga",
"value" : 2
},
{
"_id" : "sad",
"value" : 1
}
],
"timeMillis" : 27,
"counts" : {
"input" : 3,
"emit" : 3,
"reduce" : 1,
"output" : 2
},
"ok" : 1
}