这是我的数据帧:
import pandas as pd
dates = ('2020-09-24','2020-10-19','2020-12-17','2021-03-17','2021-06-17','2021-09-17','2022-03-17','2022-09-20','2023-09-19','2024-09-17','2025-09-17','2026-09-17','2027-09-17','2028-09-19','2029-09-18','2030-09-17','2031-09-17','2032-09-17','2035-09-18','2040-09-18','2045-09-19')
factors = ('1','0.999994','0.999875','1.000166','1.000303','1.000438','1.00056','1.000817','1.001046','1.001412','1.001525','1.001334','1.000685','0.999376','0.997456','0.994626','0.991244','0.986754','0.982072','0.962028','0.925136')
df = pd.DataFrame()
df['dates']=dates
df['factors']=factors
df['dates'] = pd.to_datetime(df['dates'])
df.set_index(['dates'],inplace=True)
df
这是另一个具有固定间隔的时间序列的数据帧
interpolated = pd.DataFrame(0, index=pd.date_range('2020-09-24', '2045-09-19', freq='3M'),columns=['result'])
目标是用第一个表中的三次样条插值填充第二个数据帧。感谢的所有想法
尝试
interpolated['result'] = df['factors'].interpolate(method='cubic')
然而,它在积分数据帧中只给出NaN值。不确定如何正确引用第一个表。
首先,形状不匹配。由于df中的索引中似乎没有一个日期与插值中的日期匹配,因此最终只会在日期上填充NaN。我认为您想要更像merge或join的东西,如本文所述:使用numpy/pandas按时间戳合并时间序列数据合并加入也会有所帮助。