堆栈数据帧(python)



我试图通过使用函数stack()在python中堆叠一个数据帧,但有些东西无法正常工作。

我的数据帧具有以下结构:

>              BE       BG       CZ      ...
> AT_CPA_A02   0.0706   0        0.3879  ... 
> BE_CPA_A02   38.8601  0.0001   0.0233  ...      
> BG_CPA_A02   0        95.2664  0.      ...
>     ...        ...      ...      ...

我要找的是:

>              Country Val.
> AT_CPA_A02   BE      0.0706   
> AT_CPA_A02   BG      0
> AT_CPA_A02   CZ      0.3879
> ...
> BE_CPA_A02   BE      38.8601   
> BE_CPA_A02   BG      0.0001
> BE_CPA_A02   CZ      0.0233 
> ...     

尽管如此,当在df = df.stack()中使用函数stack()时,结果是:

>              Country BE.      BG.     CZ
> AT_CPA_A02   BE      0.0706   NA.     NA.
>              BG      NA.      0.      NA.
>              CZ      NA.      NA.     0.3879.   
> ...
> BE_CPA_A02.  BE.     38.8601  NA.     NA. 
>              BG.     NA.      0.0001  NA
>              CZ.     NA.      NA.     0.0233
> ... 

当将该函数与一些示例数据一起使用时,它可以完美地工作。。。

有人能帮我吗?提前感谢

一个选项是使用.melt。按照我的做法,你必须先重置索引,然后再将其设置回:

df = df.reset_index().melt(id_vars='index', var_name='Country', value_name='Val.').set_index('index')
df
Out[1]: 
Country     Val.
index                      
AT_CPA_A02      BE   0.0706
BE_CPA_A02      BE  38.8601
BG_CPA_A02      BE   0.0000
AT_CPA_A02      BG   0.0000
BE_CPA_A02      BG   0.0001
BG_CPA_A02      BG  95.2664
AT_CPA_A02      CZ   0.3879
BE_CPA_A02      CZ   0.0233
BG_CPA_A02      CZ   0.0000

你走在了正确的轨道上。请尝试:

df.stack().reset_index(level=1).rename(columns={'level_1':'Country',0:'Val' })

Country      Val
AT_CPA_A02      BE   0.0706
AT_CPA_A02      BG   0.0000
AT_CPA_A02      CZ   0.3879
BE_CPA_A02      BE  38.8601
BE_CPA_A02      BG   0.0001
BE_CPA_A02      CZ   0.0233
BG_CPA_A02      BE   0.0000
BG_CPA_A02      BG  95.2664
BG_CPA_A02      CZ   0.0000

最新更新