我用Pandas导入了一个CSV到Python中,我希望能够使用一个作为列作为事务ID,以便我制定关联规则。
(链接:https://github.com/antonio1695/Python/blob/master/nearBPO/facturas.csv)我希望有人能帮我:
使用UUID作为我的事务ID,以获得如下数据帧:
UUID Desc
123ex Meat,Beer
为了让我得到像{Meat} => {Beer}这样的关联规则。
同时,如果能推荐一个库以一种简单的方式完成此操作,将不胜感激。
谢谢你的时间。
您可以通过以下操作将值聚合到一个列表中:
df.groupby('UUID')['Desc'].apply(list)
这将给你你想要的,如果你想UUID作为一个列返回,你可以调用上面的reset_index
:
df.groupby('UUID')['Desc'].apply(list).reset_index()
同样,对于一个系列,您仍然可以将其导出为csv格式,就像df:
一样。df.groupby('UUID')['Desc'].apply(list).to_csv(your_path)
您可能需要在导出之前命名索引,或者如果您发现使用reset_index
将索引恢复为列更容易,然后调用to_csv