所以我第一次尝试apachearrow,并希望将整个txt文件目录读取到pyarrow数据结构中。我得到
pyarrow.lib.ArrowInvalid: CSV parse error: Expected 9 columns, got 1
当我运行下面的代码时?不知道如何调试。感谢任何帮助。如果有一本关于蟒蛇和pyarrow的书很乐意阅读。
import pyarrow.csv as csv
import pyarrow as pa
l_all_files = ['x08.txt', 'x21.txt', 'x108.txt']
read_options = csv.ReadOptions( column_names= ('Sol' , 'H20', 'H50', 'H100', 'Date', 'Cv', 'Dys', 'Ple' , 'Cl') , skip_rows=26)
df_arrow_all = pa.concat_tables(( csv.read_csv(current_filename,read_options=read_options, ) for current_filename in l_all_files))
当skip_rows=26完成时,这就是该行看起来像的样子
$sss 3431 3232 3249 25523 35.66 57 56le 77.73
delmt = 't'
df = csv.read_csv(current_filename
,read_options=read_options
,parse_options=csv.ParseOptions(delimiter=delmt)
这对我有用!信用:@Mike67