所以,我有一个带有键值对(SecondName,FirstName)的RDD。让我们称之为第二名第一名。现在我想为所有与姓氏有关的名字创建(名字,名字)对。这加入会起作用吗?
SecondNameFirstName.join(SecondNameFirstName).map(x => x._2)
这个想法是,在进行连接后,我将拥有(SecondName,(FirstName,FirstName))的键值对。现在,通过仅获取第二个元组,我将拥有(FirstName,FirstName)的键值对。
为什么要麻烦加入rdd?您可以将初始 rdd 映射到所需的结果:
val firstFirst= secondFirst.map{case (second, first) => (first, first)}