在scala中从数据框架中添加两列



我在DF中存储了两列age和salary。我只是想写一个scala代码来按列添加这些值。我试着

val age_1 = df.select("age")
val salary_1=df.select("salary")
val add = age_1+salary_1

给出错误。请帮忙

在下面的示例中,sparkSparkSession的实例,因此导入必须在spark的实例化之后

$-notation可以在这里使用

导入spark隐式
import spark.implicits._ 

则使用$-notation

val add = df.select($"age" + $"salary")

最终scala代码:

import spark.implicits._
val add = df.select($"age" + $"salary")
Apache文档

相关内容

  • 没有找到相关文章

最新更新