我正在使用python.
我正在使用csv.
我正在和pandas一起工作。DataFrame.
我有大约100万张发票。
发票格式如下:
发票1:
- 梨 苹果橙色
发票2:
- 猕猴桃
- 橘子 菠萝
发票3:
- 瓜
- 梨 西瓜
……
我想要得到这个:
梨
通常与:
一起出售苹果- 橙色
- 瓜西瓜
有什么有效的方法吗?
提前感谢。
这就是所谓的市场篮子分析。
Python包mlxtend.frequent_patterns可以为你做这些。有很多文章告诉你如何做到这一点,下面是一个很有用的文章:https://pbpython.com/market-basket-analysis.html