我有两个数据集,如下所示。
数据1:lat/lon-log
#log_id, lat, lon
0001 , 31.30272 , 103.66426
0002 , 31.23483 , 103.12323
:
数据2:六边形网格信息
#grid_id, point1_lat , point1_lon , ・・・ , point6_lat , point6_lon
000001, 31.30272 , 103.66426 , 31.30272 , 103.66426 , ・・・ , 31.30242 , 103.65676
:
我如何提取数据2中与数据1中的日志ID对应的网格ID,如下所示。
log_id , grid_id
0001 , 000324
0002 , 002341
:
我正在使用PostgreSQL或python
我认为您应该使用外部合并将两个或多个数据集合并到一个中
示例:
merged_data = pd.merge(data1, data2, how='outer)
然后您可以从合并的数据中选择两个id
selected_columns = merged_data[merged_data['log_id'] & merged_data['grid_id']]
print(selected_columns)