我需要阅读一些CSV文件,并且我得到关于文件列的错误:
extracted_file = pd.read_csv(filename)
ParserError: Error tokenizing data. C error: Expected 2 fields in line 52, saw 3
在调查我的文件后,我觉得这是从错误所在的第52行开始的格式化方式,每行末尾都有一个额外的逗号:
(line 50) Name, xxx
(line 51) Serial, yyy
(line 52) 1, 5.00,
(line 53) 2,6.00,
(line 54) 3,7.00,
当我尝试使用
修复这个问题时:extracted_file = pd.read_csv(filename, error_bad_lines=False)
extracted_file在我的数据中只显示第44行。不方便的是,我实际上只需要52行以后的数据!有办法成功导入这个吗?
谢谢!
您可以尝试设置参数skiprows=51
pd.read_csv(filename, skiprows=51)