返回类似用户的前三名艺术家 - 数据类型错误



我的代码打算为随机用户生成三个艺术家推荐。这是一个基于用户的协作过滤模型,但我遇到了一个错误,该错误读取TypeError: string indices must be integers, not Series指向我分配rating_c的行。

我检查了数据类型,但无法检测到该变量中的哪个部分正在注册为系列。有人看到这个系列是什么吗?

下面是 df 头:

userArtist.head()
users   artist             gender      plays    age
0   a       aesop rock         m           72       28.0
1   b       air                m           178      28.0
2   c       amon tobin         m           106      28.0
3   d       animal collective  m           203      28.0
4   e       annie              m           75       28.0

法典:

music_mat = userArtist.pivot_table(index='artist', columns='users', values='plays').fillna(0).apply(np.sign)
# user-item collaberative filtering of random user 
random_user = np.random.choice(userArtist.users)
# Check df for values of random user
random_user_rating = music_mat[random_user]
# Pairwise correlation of top five similar users 
user_corr = music_mat.corrwith(random_user_rating)[:5]
rating_c = userArtist[(userArtist.artist.isnull().values) & (userArtist.users != random_user)]
rating_c['similarity'] = rating_c['users'].map(user_corr.get)
rating_c['sim_rating'] = rating_c.similarity * rating_c.plays
recommendation = rating_c.groupby('artist').apply(lambda s: s.sim_rating.sum() / s.similarity.sum())
recommendation

我认为行中有一个错误:

rating_c = userArtist[random_user[userArtist.artist].isnull().values & (userArtist.users != random_user)]

正如您所定义的,random_user是一个字符串,并且您正在使用序列对其进行索引

random_user[userArtist.artist]

最新更新