我有一个数据框架,看起来像这样:
ID | Company_Id | value | 批准或拒绝 | 3412 asd | 值1 | 批准 |
---|---|---|---|
2 b | 2345 tyu | 值2 | 批准 |
3 c | 9800 bvd | 3 | 批准 |
2 b | 2345 tyu | 值1 | 批准 |
pyspark pivot
df.groupBy('ID', 'Company_Id').pivot('value').agg(first('Approve or Reject')).show()