我在python中导入了一个csv作为df。以下是数据示例。我想知道该如何准备/转换这些数据。我想看看哪些地方的投票结果最相似,并考虑对此使用聚类分析。有人知道如何准备这些数据吗?谢谢
地点 | %是 | |
---|---|---|
PLace A | 投票1 | 54.2|
地点B | 投票1 | 55.6 |
地点C | 投票1 | 46.8 |
PLace A | 投票2 | 34.6 |
地点B | 投票2 | 65.3 |
地点C | 投票2 | 35.7 |
地点Z | 投票208 | 48.7 |
根据您的描述,您似乎想要透视数据帧:
print(df.pivot(index="Place", columns="Vote", values="% yes"))
打印:
Vote Vote 1 Vote 2 Vote 208
Place
PLace A 54.2 34.6 NaN
Place B 55.6 65.3 NaN
Place C 46.8 35.7 NaN
Place Z NaN NaN 48.7