我试图通过使用函数stack()
在python中堆叠一个数据帧,但有些东西无法正常工作。
我的数据帧具有以下结构:
> BE BG CZ ...
> AT_CPA_A02 0.0706 0 0.3879 ...
> BE_CPA_A02 38.8601 0.0001 0.0233 ...
> BG_CPA_A02 0 95.2664 0. ...
> ... ... ... ...
我要找的是:
> Country Val.
> AT_CPA_A02 BE 0.0706
> AT_CPA_A02 BG 0
> AT_CPA_A02 CZ 0.3879
> ...
> BE_CPA_A02 BE 38.8601
> BE_CPA_A02 BG 0.0001
> BE_CPA_A02 CZ 0.0233
> ...
尽管如此,当在df = df.stack()
中使用函数stack()
时,结果是:
> Country BE. BG. CZ
> AT_CPA_A02 BE 0.0706 NA. NA.
> BG NA. 0. NA.
> CZ NA. NA. 0.3879.
> ...
> BE_CPA_A02. BE. 38.8601 NA. NA.
> BG. NA. 0.0001 NA
> CZ. NA. NA. 0.0233
> ...
当将该函数与一些示例数据一起使用时,它可以完美地工作。。。
有人能帮我吗?提前感谢
一个选项是使用.melt
。按照我的做法,你必须先重置索引,然后再将其设置回:
df = df.reset_index().melt(id_vars='index', var_name='Country', value_name='Val.').set_index('index')
df
Out[1]:
Country Val.
index
AT_CPA_A02 BE 0.0706
BE_CPA_A02 BE 38.8601
BG_CPA_A02 BE 0.0000
AT_CPA_A02 BG 0.0000
BE_CPA_A02 BG 0.0001
BG_CPA_A02 BG 95.2664
AT_CPA_A02 CZ 0.3879
BE_CPA_A02 CZ 0.0233
BG_CPA_A02 CZ 0.0000
你走在了正确的轨道上。请尝试:
df.stack().reset_index(level=1).rename(columns={'level_1':'Country',0:'Val' })
Country Val
AT_CPA_A02 BE 0.0706
AT_CPA_A02 BG 0.0000
AT_CPA_A02 CZ 0.3879
BE_CPA_A02 BE 38.8601
BE_CPA_A02 BG 0.0001
BE_CPA_A02 CZ 0.0233
BG_CPA_A02 BE 0.0000
BG_CPA_A02 BG 95.2664
BG_CPA_A02 CZ 0.0000