如何提取熊猫时间序列数据的速率



例如,考虑

Temp       Hum        WS
DateTime                                         
2019-08-01 00:00:00   35.9615  20.51460  1.287225
2019-08-01 00:20:00   36.5795  21.92870  2.213225
2019-08-01 00:40:00   36.2885  22.62970  2.331175
2019-08-01 01:00:00   36.1095  22.76075  2.532800

间隔显然是20分钟,但有提取它的功能吗?我正在写一个脚本,使用df.resample(rate(.mean((重新采样到较低的分辨率我想确保只有当速率大于df的速率时才运行脚本。将较低分辨率的数据转换为较高分辨率是没有意义的。在本例中,"60T"的速率是可以接受的,因为它将把20分钟的数据转换为每小时的数据。但是,"10T"的费率是不可接受的。

尝试:

# if index not datetime object, then
# df.index = pd.to_datetime(df.index)
>>> pd.Series(df.index).diff().mean().components.minutes
20
#or,
>>> pd.Series(df.index).diff().iloc[-1].components.minutes
20

这取决于数据,如果指定了频率,则使用DatetimeIndex.freqstr:

print (df.index.freqstr)
20T

如果未指定,则可以通过转换的DatetimeIndex将其与DataFrame.asfreq:进行比较

idx = df.asfreq('20T').index
m = (df.index == idx).all()
print (m)
True
print (idx.freqstr)
20T