如何显示排序的数据帧列名称



我有一个超过 250 列的数据帧。 我可以使用df.printSchema显示列,也可以使用 df.columns 获取它,有没有办法按排序顺序获取列名(只是列名 - 而不是列的内容)asc/desc ?

PySpark:

sorted(df.columns)

斯卡拉:

df.columns.sorted

如果我们还需要查看数据类型以及按列名排序:

sorted(df.dtypes)

df.dtypes - 返回元组数组[(column_name, type), (column_name, type)...]

sorted - 默认情况下将按每个元组中的第一个值排序。因此,我们将获得按列名排序的所需结果,并获取每列的类型。

相关内容

  • 没有找到相关文章

最新更新