表1
<表类>
c1
c2
c3
tbody><<tr>蚂蚁 蜜蜂 苹果 B C 45 6 表类>
这是我的解决方案。基本上,您应该:
-
将dfs与外部连接合并到"c3">
-
删除所有具有NaN值的行
import pandas as pd my_df = pd.DataFrame({'c1': ['Ant', 'A', 4], 'c2': ['Bee', 'B', 5], 'c3': ['Apple', 'C', 6] }) my_df2 = pd.DataFrame({'A1': ['G', 'H', 8], 'A2': ['H', 's', 'asd'], 'c3': ['Apple', 'C', 4] }) final = my_df.merge(my_df2, on='c3', how='outer').dropna()
结果:
c1 | c2 | c3 | A1 | A2
-------------------------------
Ant | Bee | Apple | G | H
A | B | C | H | s