在不计算新偏移量的情况下对熊猫时间序列进行重采样



我正在读取仅包含可用时间的时间序列数据。 这会导致Series没有缺失值,但索引间距不等。 我想将其转换为具有等间距索引和缺失值的Series。 由于我不知道先验的间距是多少,所以我目前正在使用这样的函数

min_dt      = np.diff(series.index.values).min()
new_spacing = pandas.DateOffset(days=min_dt.days, seconds=min_dt.seconds,
                                microseconds=min_dt.microseconds)
series      = series.asfreq(new_spacing)

来计算间距应该是多少(请注意,这是使用 Pandas 0.7.3 - 0.8 beta 代码看起来略有不同,因为我必须使用 series.index.to_pydatetime() 才能在 Numpy 1.6 中正确行为)。

有没有更简单的方法可以使用熊猫库执行此操作?

如果你想在没有

数据的地方使用 NaN,你可以使用位于日期工具中的Minute()(从 pandas 0.7.x 开始)

from pandas.core.datetools import day, Minute
tseries.asfreq(Minute())

这应该提供一个均匀间隔的时间序列,与 NaN 相差 1 分钟,作为没有数据的序列值。

最新更新