pd.read_import具有不同设置的多张图纸



我正在导入一个非常大(60+MB(的xlsx文件,其中包含许多选项卡。只需要一个选项卡就可以跳过,我试过了:

TuFile=pd.read_excel('TUp.xlsx', sheet_name=['T_up','Raw_Data','Base','Summary'], skiprows=[8,None,None,None])

注意:我正在尝试复制:TuFile = xls.parse(xls.sheet_names[3], skiprows=8),它非常有效,只是我不能使用工作表名称。

当您像这里所做的那样使用pandas.read_excel()加载多张图纸时,这些图纸将存储在一个字典中,关键字是各自的图纸名称。当以这种方式在加载多张图纸时传递skiprows参数时,将从所有图纸中跳过指定数量的顶部行或给定的行列表。

例如,如果您的代码被修改如下,

TuFile=pd.read_excel('TUp.xlsx', sheet_name=['T_up','Raw_Data','Base','Summary'], skiprows=[8])

这将在加载所有工作表的数据时跳过前8行。

当指定行列表时,

TuFile=pd.read_excel('TUp.xlsx', sheet_name=['T_up','Raw_Data','Base','Summary'], skiprows=[1, 8])

加载数据时,这将跳过所有工作表中的第一行和第八行。

因此,如果你只想跳过其中一张工作表中的行,最好的选择是通过定义工作表名称将其单独加载,然后加载其余的行。假设你只想在"T_up"工作表中跳过行,并保持其余的行不变,你可以这样做,

TuFile=pd.read_excel('TUp.xlsx', sheet_name='T_up', skiprows=[8])
TuFile=pd.read_excel('TUp.xlsx', sheet_name=['Raw_Data','Base','Summary'])

最新更新