我有一个看起来类似的数据集(但有10000行而不是6行,还有100个不同的艺术家和更多的流派:
年份 | 流派 | 艺术家成本 | |
---|---|---|---|
2018 | 古典 | 巴赫 | 5|
2019 | 爵士乐 | 贝多芬 | 6|
2019 | 摇滚 | 莫扎特10 | |
2020 | 古典 | 贝多芬 | 5//tr>|
2019 | 摇滚 | 贝多芬10 | |
2020 | 古典 | 贝多芬
您的预期输出是什么?
df.groupby(['Genre','Artist']).Cost.sum()
做你想做的事?