如何在火花数据帧中的列之间进行一些计算?



例如,我想加上 la 和 lon 列,输出结果在另一列中。

+------+------------------+------------------+
|userid|               la |               lon|
+------+------------------+------------------+
|    u3|               2.0|               2.0|
|    u4|               1.0|               1.0|
|    u5|               2.0|               2.0|
|    u1|1.6666666666666667|2.6666666666666665|
|    u6|               1.0|               3.5|
|    u2|               3.0|               4.0|
+------+------------------+------------------+

如果你只需要将两列相加,那就很简单了:

df.withColumn("x", $"la" + $"lon")

x 是新列的名称。

要将列提升为 2 的幂:

df.withColumn("x", pow($"la" + $"lon", 2))

最新更新