我有两个具有相同标头的数据帧。当我尝试连接(pd.concat()
(这两个dfs(df1,df2(时,我得到错误:
"InvalidIndexError: Reindexing only valid with uniquely valued Index objects"
我发现问题在于每个数据帧中都有重复的列名。示例:
df1
respondent ID - Column1 - Column2 - Column3 - Column1 - Column2 - Column3
df2
respondent ID - Column1 - Column2 - Column3 - Column1 - Column2 - Column3
理论上,我只想在df1下面添加df2的数据(没有df2-ofc的头(
我该如何绕过它?有什么想法吗?
重复列不应该是问题(即使使用ignore_index=False
(:
df1 = pd.DataFrame([range(7)], columns=['respondent ID', 'Column1', 'Column2', 'Column3', 'Column1', 'Column2', 'Column3'])
df2 = pd.DataFrame([['2']*7], columns=['respondent ID', 'Column1', 'Column2', 'Column3', 'Column1', 'Column2', 'Column3'])
pd.concat([df1, df2], ignore_index=True)
输出:
respondent ID Column1 Column2 Column3 Column1 Column2 Column3
0 0 1 2 3 4 5 6
1 2 2 2 2 2 2 2
您可以使用以下解决方案:
df1 = df1.append(df2, ignore_index=True)