创建许多列的副本并自动重命名它们



我在Python中使用pandas。

import pandas as pd

假设我有一个数据帧

pd.DataFrame({"A": [1,2,3], "B": [3,2,1]})

我想为每列制作三个副本,并将这些列命名为 A1 到 A4,以及 B1 到 B4。所需输出示例:

pd.DataFrame({"A1": [1,2,3], "A2": [1,2,3], "A3": [1,2,3], "A4": [1,2,3], "B1": [3,2,1], "B2": [3,2,1], "B3": [3,2,1], "B4": [3,2,1]})

我该怎么做?

pd.concatadd_suffix一起使用,即

ndf = pd.concat([df.add_suffix(str(i+1)) for i in range(4)],1)

输出:

  A1 B1 A2 B2 A3 B3 A4 B40   1   3   1   3   1   3   1   31   2   2   2   2   2   2   2   22   3   1   3   1   3   1   3   1

对于排序列,请使用ndf = ndf.sort_index(1)

根据您的数据帧,您可以构造以下数据帧:

pd.DataFrame({'{}{}'.format(c,i): v for c,v in df.to_dict().items()
                                    for i in range(1,5)})

df原始数据帧。然后生成:

>>> pd.DataFrame({'{}{}'.format(c,i): v for c,v in df.to_dict().items()
...                                     for i in range(1,5)})
   A1  A2  A3  A4  B1  B2  B3  B4
0   1   1   1   1   3   3   3   3
1   2   2   2   2   2   2   2   2
2   3   3   3   3   1   1   1   1

或者更短一点(但有些人认为这种语法不是很安全:

pd.DataFrame({'%s%s'%(c,i): v for c,v in df.to_dict().items()
                              for i in range(1,5)})
df=pd.concat([df]*4,1,keys=[str(i+1) for i in range(4)])
df.columns=df.columns.swaplevel().map(''.join)
df
Out[493]: 
   A1  B1  A2  B2  A3  B3  A4  B4
0   1   3   1   3   1   3   1   3
1   2   2   2   2   2   2   2   2
2   3   1   3   1   3   1   3   1

最新更新