我正试图从一个数据集中获得每个州的选举获胜者,该数据集拥有2020年总统选举中每个县的选票。
我从这个开始
data = pd.read_csv('..Datapresident_county_candidate.csv', lineterminator='n')
group = data.groupby(
['state', 'candidate'], as_index=False
).agg(
totalVoteSum=('total_votes', 'sum')
)
group
目前的结果是点击
我现在想要的是一份获胜候选人所在州的名单,例如
州 | 候选人 | 投票
---|---|
阿拉斯加 | 唐纳德·特朗普 | 1441168
阿拉巴马州 | 唐纳德·特朗普 | <18992>
虽然我不确定这是怎么回事:
idx = group.groupby(['state'])['totalVoteSum'].transform(max) == group['totalVoteSum']
group[idx]
感谢RJ Andriaansen