通过映射分区在dask.dataframe上应用h3.string_to_h3



我想问一下如何将dd.map_partitions用于h3.string_to_h3函数。我的数据帧看起来像这个

yelevation//tr>-52.042272393235.906794-23.0095896-52.0311077.445492e+06-52.059487.450333e+06-52.049591
h3 lat lon x
2 8ca80c8e91015ff -23.0681347.448557e+06
3 8ca80c8ecadd1ff394401.401086
8ca80cbb455b1ff -23.052007391822.030340
5 8ca80cbb6a06dff -23.045227392468.0076627.451088e+06
8ca80c85876e9ff

我认为map_partitions执行了它在tin上所说的操作——也就是说,它应用了一个接受分区数据帧作为输入的映射函数。然后,您可以在该函数中操作分区本身。

我还没有测试下面的代码,但我相信这应该有效:

df['h3'] = df.map_partitions(
lambda partition: partition['h3'].apply(h3.string_to_h3),
meta=('h3', np.uint64),
)

最新更新