如何在一个预定的数据帧上执行二进制搜索?



我有一个按列排序的数据框架;我需要执行一个二分搜索来找到第一个等于或大于指定值的值。
有没有办法在Spark中有效地做到这一点?

你想要的是不可能的。它是一个批量处理框架,其中join使用不同的技术发挥普遍作用。

在文档中我没有看到或读到二分查找的其他地方。那是我在大学里用内存Pascal结构做的。

最新更新