如何在python中匹配时间序列



我有两个3个月的高频时间序列数据。问题是,一个从15:30到23:00,另一个从01:00到00:00。有没有办法通过丢弃额外的数据来匹配这两个时间序列,以便进行一些回归分析?

use可以使用pandas系列的函数combine_first。如果两个序列都包含相同的索引,则此函数选择调用对象的元素
以下代码显示了一个最小示例:

idx1 = pd.date_range('2018-01-01', periods=5, freq='H')
idx2 = pd.date_range('2018-01-01 01:00', periods=5, freq='H')
ts1 = pd.Series(range(len(ts1)), index=idx1)
ts2 = pd.Series(range(len(ts2)), index=idx2)
idx1.combine_first(idx2)

这提供了一个数据帧,内容为:

2018-01-01 00:00:00    0.0
2018-01-01 01:00:00    1.0
2018-01-01 02:00:00    2.0
2018-01-01 03:00:00    3.0
2018-01-01 04:00:00    4.0
2018-01-01 05:00:00    4.0

对于更复杂的组合,可以使用combine

最新更新