我在DF中存储了两列age和salary。我只是想写一个scala代码来按列添加这些值。我试着
val age_1 = df.select("age")
val salary_1=df.select("salary")
val add = age_1+salary_1
给出错误。请帮忙
在下面的示例中,spark
是SparkSession
的实例,因此导入必须在spark
的实例化之后。
$-notation可以在这里使用
导入spark隐式import spark.implicits._
则使用$-notation
val add = df.select($"age" + $"salary")
最终scala代码:
import spark.implicits._
val add = df.select($"age" + $"salary")
Apache文档