我在Python中使用pandas。
import pandas as pd
假设我有一个数据帧
pd.DataFrame({"A": [1,2,3], "B": [3,2,1]})
我想为每列制作三个副本,并将这些列命名为 A1 到 A4,以及 B1 到 B4。所需输出示例:
pd.DataFrame({"A1": [1,2,3], "A2": [1,2,3], "A3": [1,2,3], "A4": [1,2,3], "B1": [3,2,1], "B2": [3,2,1], "B3": [3,2,1], "B4": [3,2,1]})
我该怎么做?
将pd.concat
与add_suffix
一起使用,即
ndf = pd.concat([df.add_suffix(str(i+1)) for i in range(4)],1)
输出:
A1 B1 A2 B2 A3 B3 A4 B40 1 3 1 3 1 3 1 31 2 2 2 2 2 2 2 22 3 1 3 1 3 1 3 1
对于排序列,请使用ndf = ndf.sort_index(1)
根据您的数据帧,您可以构造以下数据帧:
pd.DataFrame({'{}{}'.format(c,i): v for c,v in df.to_dict().items()
for i in range(1,5)})
df
原始数据帧。然后生成:
>>> pd.DataFrame({'{}{}'.format(c,i): v for c,v in df.to_dict().items()
... for i in range(1,5)})
A1 A2 A3 A4 B1 B2 B3 B4
0 1 1 1 1 3 3 3 3
1 2 2 2 2 2 2 2 2
2 3 3 3 3 1 1 1 1
或者更短一点(但有些人认为这种语法不是很安全:
pd.DataFrame({'%s%s'%(c,i): v for c,v in df.to_dict().items()
for i in range(1,5)})
df=pd.concat([df]*4,1,keys=[str(i+1) for i in range(4)])
df.columns=df.columns.swaplevel().map(''.join)
df
Out[493]:
A1 B1 A2 B2 A3 B3 A4 B4
0 1 3 1 3 1 3 1 3
1 2 2 2 2 2 2 2 2
2 3 1 3 1 3 1 3 1