如何按id合并Spark数据帧



假设我有一个数据帧x,其中包含:id,C.

假设我有一个数据帧y,其中包含:a,B,id。

如何在数据帧y中找到id相同的行,并合并y中的所有内容。

结果应该是:

DataFrame:[A,B,C,id]

像这样:

>>> merged = x.join(y, "id")
merged = x.join(y, y.id==x.id)

使用drop()删除不必要的列。

相关内容

  • 没有找到相关文章

最新更新