基于列数据类型的 Pyspark 数据帧迭代



我有一个pyspark数据帧,其中包含列结构,整数和其他列。我只想动态选择结构列(不知道列名,可能存在多个列)。请有人在 PySpark 中帮助我

您可以使用

列表推导式检索struct列,然后将结果插入select()语句中:

cols = [i.name for i in df.schema.fields if "StructType" in str(i.dataType)]
df.select(cols)

相关内容

  • 没有找到相关文章

最新更新