删除行(即用 NaN 填充)并在熊猫数据帧中插值



我正在使用一些时间序列数据,需要过滤掉一些垃圾。目标是保留时间戳并插值垃圾数据。

我尝试过过滤掉 int 并重新索引,但 python 似乎对日期时间索引的处理

方式不同。所以,尝试了

ogIndex = df.index
df = df[df[col to filter] > some filter #]   # drops the index
df.reindex(ogIndex)

......没用

假设时间戳是数据帧的索引 - 与其用df = df[df[col to filter] > some filter]删除它,只需反转过滤器(以选择您不想保留的行(并将过滤后的行设置为 NaN:

import numpy as np
df[df[col to filter] < some filter] = np.nan

这将保留索引并使行适用于插值。之后,您可以使用插值方法,例如:

df.interpolate(method='linear', limit_direction='forward', axis=0)

相关内容

  • 没有找到相关文章

最新更新