我有一个类似的表
book_id original_title tag_id tag_name
1 The Hunger Games 11305 fantasy
1 The Hunger Games 26771 scifi
1 The Hunger Games 26138 romance
10000 The First World War 14467 historical
10000 The First World War 21689 nonfiction
我想创建一个数据透视表,然后根据类型找到相互关联的书籍。我已经只使用了评级,但这相对简单,因为每本书只有一个评级。由于每本书都有多种类型,有没有一个好的方法来创建这个数据透视表?
这是为了创建一个简单的推荐系统。
也许这会有所帮助:
df.pivot(index='original_title',columns='tag_name',values='tag_id')