MongoDB MapReduce Stats Engine

我正在尝试为MongoDB系统开发一个通用的报告引擎，它将聚合一组文档中的信息。在查询运行之前，我不会知道文档的结构。

例如，一组文档可能如下所示：

{"drink": "Tea","accompaniments": ["Biscuits","Crisps"]}
{"drink": "Tea","accompaniments": ["Biscuits"]}
{"drink": "Coffee","accompaniments": ["Biscuits","Crisps"]}
{"drink": "Coffee","accompaniments": ["Nuts","Biscuits"]}
{"drink": "Beer","accompaniments": ["Nuts","Crisps"]}
{"drink": "Beer","accompaniments": ["Nuts"]}
{"drink": "Beer","accompaniments": ["Crisps"]}

在这里，我需要这样的结果：

{drink:{Tea:2,Coffee:2,Beer:3},accompaniments:{biscuits:4,Crisps:4,Nuts:3}}

另一个文档集可能如下所示：

{"favcolor": "Red","shapes": ["Square","Circle"]}
{"favcolor": "Red","shapes": ["Square"]}
{"favcolor": "Green","shapes": ["Circle"]}

可能有任意数量的不同文档格式。

因此，我无法使用命名键"硬编码"map-reduce 函数。另外，请注意，我需要从嵌套数组和/或文档中获取信息 - 我控制文档的构建方式，因此，举个例子，如果需要，我可以将伴奏数组设置为一组适当的嵌套文档（在此示例中，它们是从多项选择复选框构建的）。

从每组文档中获取所有统计数据的最有效地图缩减函数是什么？我真的希望会有"一个"map-reduce能够从每个集合中获取数据。非常感谢。

我不确定我的概念，这只是一个想法。

您的两个示例数据集具有共同的结构。两者都包含具有 to 属性的文档：一个具有字符串值，第二个是数组。因此，您的map-reduce应该遍历文档属性并检查特定属性的类型。然后根据类型和属性名称进行聚合。

相关内容

最新更新

热门标签：