正在获取pyarrow.lib.ArrowInvalid:CSV分析错误:应为9列,实际为1列



所以我第一次尝试apachearrow,并希望将整个txt文件目录读取到pyarrow数据结构中。我得到


pyarrow.lib.ArrowInvalid: CSV parse error: Expected 9 columns, got 1

当我运行下面的代码时?不知道如何调试。感谢任何帮助。如果有一本关于蟒蛇和pyarrow的书很乐意阅读。


import pyarrow.csv as csv
import pyarrow as pa  

l_all_files = ['x08.txt', 'x21.txt', 'x108.txt']
read_options = csv.ReadOptions( column_names= ('Sol' , 'H20', 'H50', 'H100',  'Date', 'Cv', 'Dys', 'Ple' , 'Cl') ,  skip_rows=26)

df_arrow_all = pa.concat_tables(( csv.read_csv(current_filename,read_options=read_options, ) for current_filename in l_all_files))  

当skip_rows=26完成时,这就是该行看起来像的样子


$sss        3431    3232    3249  25523  35.66    57  56le   77.73
delmt = 't' 
df = csv.read_csv(current_filename
,read_options=read_options
,parse_options=csv.ParseOptions(delimiter=delmt)

这对我有用!信用:@Mike67

相关内容

最新更新