对Pandas MultiIndex进行重新采样或回填(到更高频率)



我想修改每小时股票价格的数据框,该数据框具有每小时频率和缺失值的datetime列。下面是一个最小的例子:

date_times =['2020-12-30 14:30:00+00:00',   '2022-03-20 20:00:00+00:00' ]
prices =[25.60, 21.40   ]
stock_names =['AAPL',   'MSFT'  ]
df = pd.DataFrame({'date_time':date_times, 'stock_name':prices, 'price':stock_names})
df.date_time = pd.to_datetime(df.date_time, utc = True )

我想以这样一种方式填充或重新采样,即每个股票的每小时数据和缺失值使用下一个可用的数据。

用最简单的方法。也许用这个索引重新创建一个新的数据框架并合并?不知道最简单的解决办法是什么

df1=df.set_index('date_time').resample('1H', base=14).ffill().reset_index()

如果第一行包含nan,则删除该行。

相关内容

  • 没有找到相关文章

最新更新