从Pandas Python的数据框上的关联规则的列到事务ID



我用Pandas导入了一个CSV到Python中,我希望能够使用一个作为列作为事务ID,以便我制定关联规则。

(链接:https://github.com/antonio1695/Python/blob/master/nearBPO/facturas.csv)

我希望有人能帮我:

使用UUID作为我的事务ID,以获得如下数据帧:

UUID     Desc
123ex    Meat,Beer

为了让我得到像{Meat} => {Beer}这样的关联规则。

同时,如果能推荐一个库以一种简单的方式完成此操作,将不胜感激。

谢谢你的时间。

您可以通过以下操作将值聚合到一个列表中:

df.groupby('UUID')['Desc'].apply(list)

这将给你你想要的,如果你想UUID作为一个列返回,你可以调用上面的reset_index:

df.groupby('UUID')['Desc'].apply(list).reset_index()

同样,对于一个系列,您仍然可以将其导出为csv格式,就像df:

一样。
df.groupby('UUID')['Desc'].apply(list).to_csv(your_path)

您可能需要在导出之前命名索引,或者如果您发现使用reset_index将索引恢复为列更容易,然后调用to_csv

最新更新