如何使用MapReduce找到两个大型排序数组的交集
我不认为MapReduce是正确的工具;由于数组是排序的,所以可以执行相当于合并的操作,但不是收集所有结果,而是只保留两个数组中出现的结果。很好的线性算法。但是既然你问了…
MapReduce的Map部分接受一组(键,值)对。那么给出一个数组,其中每对对应于其中一个数组中的一个元素,其中key是元素的值,值标识它来自哪个数组。然后reduce抛出两个数组中没有值的键。我将把处理副本作为练习。