分组依据而不丢失一列



我正试图从一个数据集中获得每个州的选举获胜者,该数据集拥有2020年总统选举中每个县的选票。

我从这个开始

data = pd.read_csv('..Datapresident_county_candidate.csv', lineterminator='n')

group = data.groupby(
['state', 'candidate'], as_index=False
).agg(
totalVoteSum=('total_votes', 'sum')
)
group

目前的结果是点击

我现在想要的是一份获胜候选人所在州的名单,例如

投票1441168<18992>
候选人
阿拉斯加唐纳德·特朗普
阿拉巴马州唐纳德·特朗普

虽然我不确定这是怎么回事:

idx = group.groupby(['state'])['totalVoteSum'].transform(max) == group['totalVoteSum']
group[idx]

感谢RJ Andriaansen

最新更新