我有这样的数据帧:
id Gender TV Radio
0 M Daily Daily
1 F Monthly Weekly
2 M Weekly Weekly
3 F Daily Daily
我需要将列更改为值,将值更改为列,这是我想要的输出。
id Gender Daily Monthly Weekly
0 M TV NaN NaN
0 M Radio NaN NaN
1 F NaN TV Weekly
2 M NaN NaN TV
2 M NaN NaN Radio
3 F TV NaN NaN
3 F Radio NaN NaN
我正在使用融化+枢轴,但我丢失了信息。这是我正在使用的。
idx = ['id', 'Gender']
m = df.melt(idx).pivot_table(index=idx,columns='value',values='variable',aggfunc='first')
out = m.reset_index(idx).rename_axis(index=None,columns=None)
但我得到的只是第一个值。例如,如果电视和广播每天都发生,那么我只得到第一个值。。我知道我只是先聚合,但不知道我可以用哪个函数来获得所有的值。
id Gender Daily Monthly Weekly
0 M TV NaN NaN
1 F NaN TV Weekly
2 M NaN NaN TV
3 F TV NaN NaN
使用DataFrame.melt
和GroupBy.cumcount
进行重复值计数器,然后使用Series.unstack
进行重塑:
idx = ['id', 'Gender']
m = df.melt(idx)
m['g'] = m.groupby(idx).cumcount()
m = m.set_index(idx + ['g', 'value'])['variable'].unstack()
out = m.reset_index(idx).rename_axis(index=None,columns=None)
print (out)
id Gender Daily Monthly Weekly
0 0 M TV NaN NaN
1 0 M Radio NaN NaN
0 1 F NaN TV NaN
1 1 F NaN NaN Radio
0 2 M NaN NaN TV
1 2 M NaN NaN Radio
0 3 F TV NaN NaN
1 3 F Radio NaN NaN