有一个有10列的表。其中一种列类型是struct假设列名是xyz。而xyz包含元素数组
。Xyz列包含[a:取值1,b:取值2,c:取值3…]现在我想从这个数组中删除c元素。
我该怎么做?
此代码需要在pyspark/python中完成。
你必须使用像df.select('xyz.*')
这样的东西来平化你的结构,然后根据需要使用数组函数,结构函数来重组它。