我需要一些关于使用Python/Pandas旋转表的建议
我有一个类似的数据框架:
df = {'hh': ['a', 'a', 'a', 'a', 'b', 'b', 'b', 'b'],
'id': ['1', '1', '2', '2', '1', '1', '2', '2'],
'var': ['height', 'gender', 'height', 'gender', 'height', 'gender', 'height', 'gender'],
'val': ['180', 'm', '172', 'f', '181', 'm', '170', 'f']}
hh id var val
0 a 1 height 180
1 a 1 gender m
2 a 2 height 172
3 a 2 gender f
4 b 1 height 181
5 b 1 gender m
6 b 2 height 170
7 b 2 gender f
我的数据框架应该是这样的:
index gender height
a1 m 180
a2 f 172
b1 m 181
b2 f 170
其中索引是'hh'和'id'变量
我已经试过了:
pivot = df.pivot_table(index=['hh', 'id'], columns='var', values='val')
但是我只得到索引而没有列。
任何建议都将非常感谢!
df['idx'] = df['hh'] + df['id']
df.pivot('idx', columns='var', values='val')
var gender height
idx
a1 m 180
a2 f 172
b1 m 181
b2 f 170