在熊猫中创建 24 小时 1 分钟分辨率数据集



我有一个 1 分钟分辨率的时间序列包含在pandas数据框中。对我来说,以这样一种方式填充这些时间序列的最简单(也是最有效的)方法是什么,即在数据框中存在的每个日期上,所有 1 分钟间隔都有 1 分钟的时间步长(因此日期将有 24 小时价值 1 分钟数据步长)?如果给定时间点没有数据,则它应该具有 NA 而不是值。例如,如果我有 2012 年 11 月 11 日凌晨 2 点至下午 6 点的数据和 2012 年 11 月 16 日下午 3 点至晚上 11 点的数据,则我希望两个日期都有 24 小时的 1 分钟数据点,并在没有数据的时间戳上附加 NA。

如果您有时间序列(如果时间用作索引),则可以使用 resample 方法 (http://pandas.pydata.org/pandas-docs/dev/timeseries.html#up-and-downsampling):

df.resample('1min')

编辑:

像这样:

rng1 = date_range('2012-11-11', '2012-11-12', freq='1min')
rng2 = date_range('2012-11-16', '2012-11-17', freq='1min')
rng = rng1 + rng2
df.reindex(rng)

最新更新