c#中用于大数据集的 DataFrame



我正在寻找在c#中处理大型数据集的建议。在R中,我一直在使用数据。表,它适用于在超过100万行的表上执行连接,并且需要在切片和骰子操作的同时执行基于时间序列的计算。然而,核心建模框架需要使用c#。

在c#中,我遇到过Deedle,它对于较小的数据集很好,但可能无法管理所需的大小。

我也发现了极限优化的许可解决方案,似乎有潜力。

还有其他可行的方法吗?我希望留在。net框架内,不希望执行跨语言(c#到R或Python)交互,因为这可能会表现不佳,特别是在进入需要跨边界转换大量数据的模拟工作时。c#也比Python更受欢迎,因为它适合整个公司的其他架构(web服务,UI等)。

Microsoft开始在。net中实现DataFrame

https://github.com/dotnet/machinelearning/blob/main/src/Microsoft.Data.Analysis/DataFrame.cs

它是ML.net的一部分

我目前也在c#中处理更大的数据,我需要将其传输到python并返回,如果可以的话,我建议避免使用它。

最新更新