我正在使用一些时间序列数据,需要过滤掉一些垃圾。目标是保留时间戳并插值垃圾数据。
我尝试过过滤掉 int 并重新索引,但 python 似乎对日期时间索引的处理
方式不同。所以,尝试了
ogIndex = df.index
df = df[df[col to filter] > some filter #] # drops the index
df.reindex(ogIndex)
......没用
假设时间戳是数据帧的索引 - 与其用df = df[df[col to filter] > some filter]
删除它,只需反转过滤器(以选择您不想保留的行(并将过滤后的行设置为 NaN:
import numpy as np
df[df[col to filter] < some filter] = np.nan
这将保留索引并使行适用于插值。之后,您可以使用插值方法,例如:
df.interpolate(method='linear', limit_direction='forward', axis=0)