如何根据时间间隔将时间索引 Dask 数据帧输出到 csv



我有一个时间索引数据帧,我和我想根据 15 分钟的间隔将其输出到多个 csv 文件,有没有办法在 dask 中做到这一点而不依赖于应用程序或映射?我使用的数据源可以全部在一个文件中,也可以拆分,因此现有分区会有所不同。

处理此问题的最佳方法是使用 repartition 将数据重新分区为 15 分钟分区,然后使用 to_csv 输出到文件(为每个分区创建一个文件(。

这样的事情应该有效:

df.repartition(freq='15T').to_csv(...)

最新更新