我正在尝试合并熊猫中的多个数据范围,并将列标签保持在结果框架中。这是我的测试案例:
import pandas as pd
df1 = pd.DataFrame(data = [[1,1],[3,1],[5,1]], columns = ['key','val'])
df2 = pd.DataFrame(data = [[1,2],[3,2],[7,2]], columns = ['key','val'])
df3 = pd.DataFrame(data = [[1,3],[2,3],[4,3]], columns = ['key','val'])
df = pd.merge(pd.merge(df1,df2,on='key', suffixes=['_1','_2']),df3,on='key',suffixes=[None,'_3'])
我得到了这个:
df =
key val_1 val_2 val
0 1 1 2 3
我想看到这个:
df =
key val_1 val_2 val_3
0 1 1 2 3
我指定的最后一对后缀是:[None,'_3']
,逻辑是['_1','_2']
对以前的合并创建了唯一的列名。
仅当合并的数据框架具有两个具有相同名称的列时,后缀才需要。合并DF3时,您的数据框架具有列名Val_1和Val_2,因此没有重叠。您可以通过将val重命名为val_3来处理
df = df1.merge(df2, on = 'key', suffixes=['_1','_2']).merge(df3, on = 'key').rename(columns = {'val': 'val_3'})
您必须在
上尝试一下df = pd.merge(pd.merge(df1,df2,on='key', suffixes=[None,'_2']),df3,on='key',suffixes=['_1,'_3'])
这对我来说是工作