我有一个超过 250 列的数据帧。 我可以使用df.printSchema
显示列,也可以使用 df.columns
获取它,有没有办法按排序顺序获取列名(只是列名 - 而不是列的内容)asc/desc ?
PySpark:
sorted(df.columns)
斯卡拉:
df.columns.sorted
如果我们还需要查看数据类型以及按列名排序:
sorted(df.dtypes)
df.dtypes
- 返回元组数组[(column_name, type), (column_name, type)...]
sorted
- 默认情况下将按每个元组中的第一个值排序。因此,我们将获得按列名排序的所需结果,并获取每列的类型。