比较两个csv文件,并在列匹配的地方创建第三个csv



我有两个非常大的DataFrames,它们保存为.csv文件。我想比较两个文件中的列"cell_code",并创建第三个csv文件,该文件只包含列"cell-code"具有相同值的行。这里只是DataFrames的一小部分。

第一:

technology    tac  cell_code        lon        lat
8298          LTE   6710    1924499  12.157236  47.586310
34566         LTE   4106     438273  16.541019  48.133775
34567         LTE   4106     835847  16.052141  48.077284
34640         LTE  17006     302595  16.389292  48.229125
34657         LTE  17007     238850  16.413752  48.189886

第二:

technology      tac  cell_code        lon        lat
0            LTE     7602      56541  16.529176  47.834004
1            LTE     7602      56542  16.529176  47.834004
2            LTE     7602      302595 16.529176  47.834004
3            LTE     7602      18440  16.926798  47.838448
4            LTE     7602      438273 16.926798  47.838448

您可以看到,第一个df和第二个df具有相同的"cell_code"438273和302595。

预期结果:

technology    cell_code   tac_1    tac_2       lon_1       lon_2       lat_1      lat_2
1           LTE       438273    4106     7602   16.541019   16.926798   48.133775  47.838448
2           LTE       302595   17006     7602   16.389292   16.529176   48.229125  47.834004

基本上,我需要制作第三个DataFrame,稍后将导出,它应该是这种格式。当它找到匹配的"cell_code"时,两个文件的tac、lon和lat应该在同一行。

df1.merge(df2, on=['technology' 'cell_code'], suffixes=('_1', '_2'))

最新更新