我有两个像这样的数据集:
df1
:
<表类>
日期
城市
状态数量 tbody><<tr>2019 - 01年 芝加哥td IL 35 2019 - 01奥兰多 FL 322 … … … … 2021 - 07年芝加哥td> IL 334 2021 - 07年奥兰多 FL 4332 表类>
您可以outer-merge
。通过不指定要合并的列,可以合并两个dataframe(在本例中为Date
、City
和State
)中列的交集。
out = df1.merge(df2, how='outer').sort_values(by='Date')
输出:
Date City State Quantity Sales
0 2019-01 Chicago IL 35.0 NaN
1 2019-01 Orlando FL 322.0 NaN
4 2020-03 Chicago IL NaN 30.0
5 2020-03 Orlando FL NaN 319.0
2 2021-07 Chicago IL 334.0 331.0
3 2021-07 Orlando FL 4332.0 4000.0