假设我有这些数据
ColumnA | ColumnB | 第一行 | valueA |
---|---|
第一行 | valueB |
row2 | valueB |
可以使用collect_set
和concat_ws
df.select("ColumnA","ColumnB")
.groupBy("ColumnA")
.agg(concat_ws(",",collect_set("ColumnB")))