在PySpark中保留列名



假设我们有一个具有以下列名的数据帧df['input.Name', 'input.Number']

当我执行df_new = df.select("input.Name")时,当查看df_new.columns时,列名变为['Name']。如何保留原始列名?

您应该练习不要在列名中使用句点(.(,因为句点用于指代嵌套的数据结构。示例:

{
"input": {
"Name": "test",
"Id": "test2"
}
} 

这里,input.Name是指test

如果你仍然想使用句点(.(,你可以使用反勾号(`(引用Nitish建议的列名。

df_new = df.select("`input.Name`")

这将保留原始列名。

最新更新