是否仅将选定列转换为使用融化和枢轴转置



我有这样的数据帧:

id  Gender        TV        Radio
0   M            Daily      Daily
1   F            Monthly    Weekly
2   M            Weekly     Weekly
3   F            Daily      Daily

我需要将列更改为值,将值更改为列,这是我想要的输出。

id  Gender             Daily    Monthly      Weekly
0   M                   TV       NaN          NaN
0   M                   Radio    NaN          NaN
1   F                   NaN      TV           Weekly
2   M                   NaN      NaN          TV
2   M                   NaN      NaN          Radio
3   F                   TV       NaN          NaN
3   F                   Radio    NaN          NaN

我正在使用融化+枢轴,但我丢失了信息。这是我正在使用的。

idx = ['id', 'Gender']
m = df.melt(idx).pivot_table(index=idx,columns='value',values='variable',aggfunc='first')
out = m.reset_index(idx).rename_axis(index=None,columns=None)

但我得到的只是第一个值。例如,如果电视和广播每天都发生,那么我只得到第一个值。。我知道我只是先聚合,但不知道我可以用哪个函数来获得所有的值。

id    Gender               Daily   Monthly      Weekly
0   M                   TV       NaN          NaN
1   F                   NaN      TV           Weekly
2   M                   NaN      NaN          TV
3   F                   TV       NaN          NaN

使用DataFrame.meltGroupBy.cumcount进行重复值计数器,然后使用Series.unstack进行重塑:

idx = ['id', 'Gender']
m = df.melt(idx)
m['g'] = m.groupby(idx).cumcount()
m = m.set_index(idx + ['g', 'value'])['variable'].unstack()
out = m.reset_index(idx).rename_axis(index=None,columns=None)
print (out)
id Gender  Daily Monthly Weekly
0   0      M     TV     NaN    NaN
1   0      M  Radio     NaN    NaN
0   1      F    NaN      TV    NaN
1   1      F    NaN     NaN  Radio
0   2      M    NaN     NaN     TV
1   2      M    NaN     NaN  Radio
0   3      F     TV     NaN    NaN
1   3      F  Radio     NaN    NaN

最新更新