我有两个非常大的DataFrames,它们保存为.csv文件。我想比较两个文件中的列"cell_code",并创建第三个csv文件,该文件只包含列"cell-code"具有相同值的行。这里只是DataFrames的一小部分。
第一:
technology tac cell_code lon lat
8298 LTE 6710 1924499 12.157236 47.586310
34566 LTE 4106 438273 16.541019 48.133775
34567 LTE 4106 835847 16.052141 48.077284
34640 LTE 17006 302595 16.389292 48.229125
34657 LTE 17007 238850 16.413752 48.189886
第二:
technology tac cell_code lon lat
0 LTE 7602 56541 16.529176 47.834004
1 LTE 7602 56542 16.529176 47.834004
2 LTE 7602 302595 16.529176 47.834004
3 LTE 7602 18440 16.926798 47.838448
4 LTE 7602 438273 16.926798 47.838448
您可以看到,第一个df和第二个df具有相同的"cell_code"438273和302595。
预期结果:
technology cell_code tac_1 tac_2 lon_1 lon_2 lat_1 lat_2
1 LTE 438273 4106 7602 16.541019 16.926798 48.133775 47.838448
2 LTE 302595 17006 7602 16.389292 16.529176 48.229125 47.834004
基本上,我需要制作第三个DataFrame,稍后将导出,它应该是这种格式。当它找到匹配的"cell_code"时,两个文件的tac、lon和lat应该在同一行。
df1.merge(df2, on=['technology' 'cell_code'], suffixes=('_1', '_2'))