我正在循环浏览Excel工作表并将它们附加到列表中。循环完成后,我使用 Pandas 连接到单个数据帧。我遇到的问题是将工作表名称添加到适当的列表中。
# infile is a filepath variable
xls = xlrd.open_workbook(infile, on_demand=True)
dfList = []
for sheet_name in xls.sheet_names():
df = pd.read_excel(infile, sheet_name, header = 0)
#df['Well_name'] = sheet_name
dfList.append(df)
print(sheet_name + " appended.")
#time.sleep(2)
print("Loop complete")
# Concatenating the appended lists
dfs = pd.concat(dfList, axis=0)
我尝试在 df 中创建一个新列,但这造成了长度不匹配,它也不起作用,因为它不断重写为循环中的最后一个工作表名称。
有什么想法或建议吗?
似乎您遇到了一些范围问题。避免此问题的一种方法是使用列表推导。您还可以使用pd.DataFrame.assign
在列表理解中添加系列:
dfList = [pd.read_excel(infile, sheet_name, header=0).assign(Well_name=sheet_name)
for sheet_name in xls.sheet_names()]
dfs = pd.concat(dfList, axis=0)