如何合并具有不同时间范围的两个数据集?



我有两个像这样的数据集:

df1:

<表类> 日期 城市 状态数量tbody><<tr>2019 - 01年芝加哥tdIL352019 - 01奥兰多FL322…………2021 - 07年芝加哥td> IL3342021 - 07年奥兰多FL4332

您可以outer-merge。通过不指定要合并的列,可以合并两个dataframe(在本例中为DateCityState)中列的交集。

out = df1.merge(df2, how='outer').sort_values(by='Date')

输出:

Date     City State  Quantity   Sales
0  2019-01  Chicago    IL      35.0     NaN
1  2019-01  Orlando    FL     322.0     NaN
4  2020-03  Chicago    IL       NaN    30.0
5  2020-03  Orlando    FL       NaN   319.0
2  2021-07  Chicago    IL     334.0   331.0
3  2021-07  Orlando    FL    4332.0  4000.0

最新更新