pd.read_import具有不同设置的多张图纸

我正在导入一个非常大(60+MB(的xlsx文件，其中包含许多选项卡。只需要一个选项卡就可以跳过，我试过了：

TuFile=pd.read_excel('TUp.xlsx', sheet_name=['T_up','Raw_Data','Base','Summary'], skiprows=[8,None,None,None])

注意：我正在尝试复制：TuFile = xls.parse(xls.sheet_names[3], skiprows=8)，它非常有效，只是我不能使用工作表名称。

当您像这里所做的那样使用pandas.read_excel()加载多张图纸时，这些图纸将存储在一个字典中，关键字是各自的图纸名称。当以这种方式在加载多张图纸时传递skiprows参数时，将从所有图纸中跳过指定数量的顶部行或给定的行列表。

例如，如果您的代码被修改如下，

TuFile=pd.read_excel('TUp.xlsx', sheet_name=['T_up','Raw_Data','Base','Summary'], skiprows=[8])

这将在加载所有工作表的数据时跳过前8行。

当指定行列表时，

TuFile=pd.read_excel('TUp.xlsx', sheet_name=['T_up','Raw_Data','Base','Summary'], skiprows=[1, 8])

加载数据时，这将跳过所有工作表中的第一行和第八行。

因此，如果你只想跳过其中一张工作表中的行，最好的选择是通过定义工作表名称将其单独加载，然后加载其余的行。假设你只想在"T_up"工作表中跳过行，并保持其余的行不变，你可以这样做，

TuFile=pd.read_excel('TUp.xlsx', sheet_name='T_up', skiprows=[8])
TuFile=pd.read_excel('TUp.xlsx', sheet_name=['Raw_Data','Base','Summary'])

相关内容