我的代码打算为随机用户生成三个艺术家推荐。这是一个基于用户的协作过滤模型,但我遇到了一个错误,该错误读取TypeError: string indices must be integers, not Series
指向我分配rating_c
的行。
我检查了数据类型,但无法检测到该变量中的哪个部分正在注册为系列。有人看到这个系列是什么吗?
下面是 df 头:
userArtist.head()
users artist gender plays age
0 a aesop rock m 72 28.0
1 b air m 178 28.0
2 c amon tobin m 106 28.0
3 d animal collective m 203 28.0
4 e annie m 75 28.0
法典:
music_mat = userArtist.pivot_table(index='artist', columns='users', values='plays').fillna(0).apply(np.sign)
# user-item collaberative filtering of random user
random_user = np.random.choice(userArtist.users)
# Check df for values of random user
random_user_rating = music_mat[random_user]
# Pairwise correlation of top five similar users
user_corr = music_mat.corrwith(random_user_rating)[:5]
rating_c = userArtist[(userArtist.artist.isnull().values) & (userArtist.users != random_user)]
rating_c['similarity'] = rating_c['users'].map(user_corr.get)
rating_c['sim_rating'] = rating_c.similarity * rating_c.plays
recommendation = rating_c.groupby('artist').apply(lambda s: s.sim_rating.sum() / s.similarity.sum())
recommendation
我认为行中有一个错误:
rating_c = userArtist[random_user[userArtist.artist].isnull().values & (userArtist.users != random_user)]
正如您所定义的,random_user是一个字符串,并且您正在使用序列对其进行索引
random_user[userArtist.artist]