我有一个文本文件,其中有120列和数千行,分隔符是一个选项卡。在某些行中,存在一个额外的选项卡,使该行看起来像有121列。对于所有文本文件,这个额外选项卡的位置并不相同。
我想知道是否有人对有效地定位额外的选项卡并以编程方式删除它有任何想法。
您可以在read_csv
中使用正则表达式作为分隔符。
使用't+'
(一个或多个表格(:
df = pd.read_csv('your_file.csv', sep='t+', engine='python')