小贝子编程

Pandas从CSV中透视并添加具有连续行的列

我在两列中有连续的行重复。我想删除基于[col1，col2]的第二行重复项，并将另一列的值移动到新列。

示例：

输入

col1 col2 col3
X    A   1
X    A   2
Y    A   3
Y    A   4
X    B   5
X    B   6
Z    C   7
Z    C   8

输出

col1 col2 col3 col4
X    A    1    2
Y    A    3    4
X    B    5    6
Z    C    7    8

我发现了旋转，但我很难理解如何添加另一列并避免索引，我希望保留示例中所写的所有内容

这类似于这里的问题10：

(df.assign(col=df.groupby(['col1','col2']).cumcount())
.pivot_table(index=['col1','col2'], columns='col', values='col3')
.reset_index()
)

输出：

col col1 col2  0  1
0      X    A  1  2
1      X    B  5  6
2      Y    A  3  4
3      Z    C  7  8

相关内容