我有一个包含 400 万个项目的 Cosmos DB 集合。我的主要问题是如何对其执行"分组依据"查询。
现在,我将其导出到 json.gz blob 存储。将其从本地 C# 程序转换为本地 CSV 文件。然后在其上运行一个简单的 R 脚本,该脚本执行该组依据。
我想在 Azure 中运行整个过程(使用 Azure 逻辑应用(。
最好的方法是什么?
谢谢!
适用于 .NET 和 Node.js
Larry Maccherone 提供了一个很棒的包 documentdb-lumenize,它支持聚合(分组依据、数据透视表和 N 维立方体(和时间序列转换作为 DocumentDB 中的存储过程。此外,对于Python和Scala,你可以参考azure-cosmosdb-spark。
您可以参考此线程。
希望对您有所帮助。