考虑以下数据帧和列:movies_df=['userId','movieId','分级','时间戳']rating_df=[电影ID,标题,流派]
假设"rating"是一个数字,pandas.core.groupby.groupby.mean应该有效:
movies_df.groupby('movieId')['rating'].mean()
基于评论的编辑:
似乎您需要对第一个df的评分进行分组和平均,然后将这些结果合并到第二个df中。类似于:
avg_ratings = movies_df.groupby('movieId')['rating'].mean().reset_index()
merged = pd.merge(rating_df, avg_ratings, how='outer')
merged
将包含带有movieId、标题、流派和"avg_rating"的信息