在火花中的阵列中提取值
我有一个 DataFrame
,这是架构。element
的数字未知,但是某些元素(例如element1
和element3
)必须存在,并且唯一性
root
|-- context: struct (nullable = true)
|---|-- key: string (nullable = true)
| |-- data: struct (nullable = true)
| | |-- dimensions: array (nullable = true)
| | | |-- element: struct (containsNull = true)
| | | | |-- element1: string (nullable = true)
| | | | |-- element2: string (nullable = true)
| | | | |-- element3: string (nullable = true)
| | | | |-- *** : string (nullable = true)
| | | | |-- elementN: string (nullable = true)
我如何将其转换为这样的模式?
root
|-- context: struct (nullable = true)
|---|-- key: string (nullable = true)
|---|-- element1: string (nullable = true)
|---|-- element3: string (nullable = true)
非常感谢。
您可以尝试explode
功能吗?这些是以下链接,请浏览它们。
嵌套火花数据框中提取列
使用scala