创建一个数据透视表并查找多种类型书籍之间的相关性



我有一个类似的表

book_id original_title  tag_id  tag_name
1     The Hunger Games  11305   fantasy
1     The Hunger Games  26771   scifi
1     The Hunger Games  26138   romance
10000       The First World War 14467   historical
10000       The First World War 21689   nonfiction

我想创建一个数据透视表,然后根据类型找到相互关联的书籍。我已经只使用了评级,但这相对简单,因为每本书只有一个评级。由于每本书都有多种类型,有没有一个好的方法来创建这个数据透视表?

这是为了创建一个简单的推荐系统。

也许这会有所帮助:

df.pivot(index='original_title',columns='tag_name',values='tag_id')

最新更新