Pyspark添加列到现有的数据框架



我正试图添加多列到右我怎么能做到这一点?

Attributes = ["RequestTypePesId","AgentId","UpdatedBy","CauseType","OriginatingSystem"] for i in Attributes: a = df2load.select(i).distinct() b = a.join(b,a.select(i) == b.select(i),"fullouter")

输出应该是:输入图片描述

看看这个例子:https://stackoverflow.com/a/71966176/9658895

,因为你是新手,你可能会发现这篇文章很有用:PySpark for Python的"Hello World"Pandas用户[Pandas Vs PySpark]

最后,在你问下一个问题之前,请确保你遵循了提问的标准协议。这个视频可能对你有帮助。

最新更新