为什么panda在加载具有重复列的xlsx时更改了我的types_dict



我正在将带有重复列的.xlsx加载到pandas数据帧中,并遇到了意外行为。

有人能告诉我这里到底发生了什么吗?为什么types_dict发生了变化?

test.xlsx:

c
a a b
1 1 b1 c1
2 2 b2 c2
3 3 b3 c3

因此,这看起来是read_excel的预期行为,因为它将遵循read_csv的操作方式。

正如Alex所说,文档中有mangle_dupe_cols,据说它允许导入重复的列名,但从未实现过。从pandas-dev上的13262期来看,即使有社区需求,当有重复的列名时,也很难添加支持,而且这个问题已经搁置了多年。

您可以访问此SO线程以获得解决方法

最新更新