如何比较2个Excel表格并提取共同值?



表1

<表类> c1 c2 c3 tbody><<tr>蚂蚁蜜蜂苹果BC456

这是我的解决方案。基本上,您应该:

  • 将dfs与外部连接合并到"c3">

  • 删除所有具有NaN值的行

    import pandas as pd
    my_df = pd.DataFrame({'c1': ['Ant', 'A', 4],
    'c2': ['Bee', 'B', 5],
    'c3': ['Apple', 'C', 6]
    })
    
    my_df2 = pd.DataFrame({'A1': ['G', 'H', 8],
    'A2': ['H', 's', 'asd'],
    'c3': ['Apple', 'C', 4]
    })
    
    final = my_df.merge(my_df2, on='c3', how='outer').dropna()
    

结果:

c1 |  c2 |    c3 | A1  | A2
-------------------------------
Ant | Bee | Apple | G   | H
A |  B  |    C  | H   | s

最新更新