小贝子编程

通过映射分区在dask.dataframe上应用h3.string_to_h3

我想问一下如何将dd.map_partitions用于h3.string_to_h3函数。我的数据帧看起来像这个

yelevation//tr>-52.042272393235.906794-23.0095896-52.0311077.445492e+06-52.059487.450333e+06-52.049591

我认为map_partitions执行了它在tin上所说的操作——也就是说，它应用了一个接受分区数据帧作为输入的映射函数。然后，您可以在该函数中操作分区本身。

我还没有测试下面的代码，但我相信这应该有效：

df['h3'] = df.map_partitions(
lambda partition: partition['h3'].apply(h3.string_to_h3),
meta=('h3', np.uint64),
)

相关内容