按线的名称和地理位置对地瓦人进行排序

我有一个从shapefile创建的geopandas dataFrame。

我想根据列对数据框进行排序："名称"，以及线块也应按地理位置进行排序，以便将所有具有相同名称的附近块分组在一起。

我该如何进行这种排序？

我尝试的是：1.我计算每个细胞的平均坐标：

df['mean_coord'] = df.geometry.apply(lambda g: [np.mean(g.xy[0]),np.mean(g.xy[1])])

i根据"名称"列对数据框进行分组，我根据均值坐标对生成的数据框进行排序：
：
grouped = df.sort_values（['sey_coord']，apcending = false）.groupby（'name'）

但我不确定这是这样做的最佳/最优雅甚至正确的方法。除此之外，我不知道如何从分组元素回到熊猫数据框架？

首先，我要向您展示我硬编码并被认为是代表性数据集的内容。这确实是您应该在问题中提供的东西，但是这个假期我感到很慷慨：

from shapely.geometry import Point, LineString
import geopandas
line1 = LineString([
    Point(0, 0),
    Point(0, 1),
    Point(1, 1),
    Point(1, 2),
    Point(3, 3),
    Point(5, 6),
])
line2 = LineString([
    Point(5, 3),
    Point(5, 5),
    Point(9, 5),
    Point(10, 7),
    Point(11, 8),
    Point(12, 12),
])
line3 = LineString([
    Point(9, 10),
    Point(10, 14),
    Point(11, 12),
    Point(12, 15),
])
gdf = geopandas.GeoDataFrame(
    data={'name': ['A', 'B', 'A']},
    geometry=[line1, line2, line3]
)

所以现在我要计算每条线的质心的x-和y-coortinate，平均它们按线的平均和名称进行排序，删除中间列。

output = (
    gdf.assign(x=lambda df: df['geometry'].centroid.x)
       .assign(y=lambda df: df['geometry'].centroid.y)
       .assign(rep_val=lambda df: df[['x', 'y']].mean(axis=1)) 
       .sort_values(by=['name', 'rep_val']) 
       .loc[:, gdf.columns] 
)
print(output)
  name                                       geometry
0    A      LINESTRING (0 0, 0 1, 1 1, 1 2, 3 3, 5 6)
2    A         LINESTRING (9 10, 10 14, 11 12, 12 15)
1    B  LINESTRING (5 3, 5 5, 9 5, 10 7, 11 8, 12 12)

相关内容

最新更新

热门标签：