小贝子编程

如何修改表数据以删除 Pandas 中的重复项并水平"condense"

本文关键字：condense 水平 Pandas 删除何修改修改数据 python pandas databricks
更新时间 : 2023-09-19
英文 : How do I modify table data to remove duplicates and "condense" horizontally in Pandas

我在Databricks>Python/w Pandas。我想限制数据从以下位置移动：

电话//tr>4437935472//tr>

ID	账户
1234	1	4437935470
1234	1	4437935470
1234	2
1234	2	4437935473
1235	3	4437935474
1235	4	4437935475
1236	4	4437935476
1236	4	4437935477

除了需要删除重复项外，这本质上是由两列组成的透视图。阅读本指南中的更多内容。尝试：

(df.drop_duplicates(['ID','Account','Phone'])
.assign(col=df.groupby(['ID','Account']).cumcount()+1)
.set_index(['ID','Account','col'])
['Phone'].unstack().add_prefix('Phone ')
.reset_index()
)

输出(请注意，与预期输出相比，样本数据中存在拼写错误(：

col    ID Account     Phone 1     Phone 2     Phone 3
0    1234       1  4437935470         NaN         NaN
1    1234       2  4437935472  4437935473         NaN
2    1235       3  4437935474         NaN         NaN
3    1236       4  4437935475  4437935476  4437935477

如何修改表数据以删除 Pandas 中的重复项并水平"condense"

相关内容

最新更新

热门标签：