r语言 - 如何在 Cosmos DB 上直接或间接执行"Group By"查询?



我有一个包含 400 万个项目的 Cosmos DB 集合。我的主要问题是如何对其执行"分组依据"查询。

现在,我将其导出到 json.gz blob 存储。将其从本地 C# 程序转换为本地 CSV 文件。然后在其上运行一个简单的 R 脚本,该脚本执行该组依据。

我想在 Azure 中运行整个过程(使用 Azure 逻辑应用(。

最好的

方法是什么?

谢谢!

适用于 .NET 和 Node.js

Larry Maccherone 提供了一个很棒的包 documentdb-lumenize,它支持聚合(分组依据、数据透视表和 N 维立方体(和时间序列转换作为 DocumentDB 中的存储过程。此外,对于Python和Scala,你可以参考azure-cosmosdb-spark。

您可以参考此线程。

希望对您有所帮助。

最新更新