使用变量变化拆分时间序列,在Panda中



我在那里绘图(http://db.tt/9SG85XFK)熊猫数据帧;带有两个变量的"时间戳"索引(绘制为蓝色和绿色曲线)。

我想提取数据帧的子集,其中蓝色曲线变量或多或少是常量(std.variation低于特定值?)。

因此,对于所附的图,它将提取3个不同的子集~(41000:41170、41180:41315和41320:41580)。

有干净的方法吗?我可以通过循环来完成,但是。。。不确定这是正确的方式。

谢谢,

N

您可能想要rolling_std函数的功能。

指定要检查标准偏差的间隔宽度(假设为100个数据点),选择适当的标准偏差(假设为10),然后执行:

 import pandas as pd
 s = pd.Series(the way you get your data)
 std = pd.rolling_std(s, 100)
 selected = s[std < 10]

在100个数据点的周围,你会得到所有标准偏差小于10的数据点。

最新更新