我在两列中有连续的行重复。我想删除基于[col1,col2]的第二行重复项,并将另一列的值移动到新列。
示例:
输入
col1 col2 col3
X A 1
X A 2
Y A 3
Y A 4
X B 5
X B 6
Z C 7
Z C 8
输出
col1 col2 col3 col4
X A 1 2
Y A 3 4
X B 5 6
Z C 7 8
我发现了旋转,但我很难理解如何添加另一列并避免索引,我希望保留示例中所写的所有内容
这类似于这里的问题10:
(df.assign(col=df.groupby(['col1','col2']).cumcount())
.pivot_table(index=['col1','col2'], columns='col', values='col3')
.reset_index()
)
输出:
col col1 col2 0 1
0 X A 1 2
1 X B 5 6
2 Y A 3 4
3 Z C 7 8