如何爆炸空间分离列



我在Spark Scala中有一个示例数据框,其中包含一个列和许多其他列50 ,需要爆炸ID:

示例数据:

id             name   address
234 435 567    auh    aus
345 123        muji   uk

输出数据:

id             name   address
234            auh    aus
435            auh    aus
567            auh    aus
345            muji   uk
123            muji   uk

尝试以下:

import org.apache.spark.sql.functions._
scala> df.withColumn("id", explode(split($"id", " "))).show
+---+----+-------+
| id|name|address|
+---+----+-------+
|234| auh|    aus|
|435| auh|    aus|
|567| auh|    aus|
|345|muji|     uk|
|123|muji|     uk|
+---+----+-------+

相关内容

  • 没有找到相关文章

最新更新