是否有适当的方法将每行中包含逗号分隔字符串的数据帧列转换为字典


ID 流派
1 戏剧、喜剧
2 动作、科幻、悬疑
3 恐怖,悬疑
4 喜剧
5 动作、戏剧、体育
6 喜剧、科幻
7 戏剧

您可以使用:

df['Genre'].str.get_dummies(', ').sum()

输出:

Action             2
Comedy             3
Drama              3
Horror             1
Science Fiction    2
Sports             1
Suspense           2
dtype: int64

或者,也许效率较低:

df['Genre'].str.split(',s*').explode().value_counts()

输出:

Drama              3
Comedy             3
Action             2
Science Fiction    2
Suspense           2
Horror             1
Sports             1
Name: Genre, dtype: int64

相关内容

  • 没有找到相关文章

最新更新