我正在将带有重复列的.xlsx加载到pandas数据帧中,并遇到了意外行为。
有人能告诉我这里到底发生了什么吗?为什么types_dict发生了变化?
test.xlsx:
a | a | b | c||
---|---|---|---|---|
1 | 1 | b1 | c1 | |
2 | 2 | b2 | c2 | |
3 | 3 | b3 | c3 |
因此,这看起来是read_excel
的预期行为,因为它将遵循read_csv
的操作方式。
正如Alex所说,文档中有mangle_dupe_cols
,据说它允许导入重复的列名,但从未实现过。从pandas-dev上的13262期来看,即使有社区需求,当有重复的列名时,也很难添加支持,而且这个问题已经搁置了多年。
您可以访问此SO线程以获得解决方法