我有一个时间索引数据帧,我和我想根据 15 分钟的间隔将其输出到多个 csv 文件,有没有办法在 dask 中做到这一点而不依赖于应用程序或映射?我使用的数据源可以全部在一个文件中,也可以拆分,因此现有分区会有所不同。
处理此问题的最佳方法是使用 repartition
将数据重新分区为 15 分钟分区,然后使用 to_csv
输出到文件(为每个分区创建一个文件(。
这样的事情应该有效:
df.repartition(freq='15T').to_csv(...)