火花数据框的转换



我有一个 DataFrame,这是架构。element的数字未知,但是某些元素(例如element1element3)必须存在,并且唯一性

root
 |-- context: struct (nullable = true)
 |---|-- key: string (nullable = true)
 |   |-- data: struct (nullable = true)
 |   |    |-- dimensions: array (nullable = true)
 |   |    |    |-- element: struct (containsNull = true)
 |   |    |    |    |-- element1: string (nullable = true)
 |   |    |    |    |-- element2: string (nullable = true)
 |   |    |    |    |-- element3: string (nullable = true)
 |   |    |    |    |-- ***     : string (nullable = true)
 |   |    |    |    |-- elementN: string (nullable = true)

我如何将其转换为这样的模式?

root
 |-- context: struct (nullable = true)
 |---|-- key: string (nullable = true)
 |---|-- element1: string (nullable = true)
 |---|-- element3: string (nullable = true)

非常感谢。

您可以尝试explode功能吗?这些是以下链接,请浏览它们。

嵌套火花数据框中提取列

使用scala

在火花中的阵列中提取值

相关内容

  • 没有找到相关文章

最新更新