我有这个CSV文件这个列名
['school;sex;age;address;famsize;Pstatus;Medu;Fedu;Mjob;Fjob;reason;guardian;traveltime;studytime;failures;schoolsup;famsup;paid;activities;nursery;higher;internet;romantic;famrel;freetime;goout;Dalc;Walc;health;absences;G1;G2;G3']
这只包括一列,但我想把它们分开。我尝试使用regex
。将它们从;
中分离出来,这是一种语法,但我不确定如何进行
如果example.csv
正在混合等分离器
ID,Name,school;sex;age;address
1,Bart,Springfield;M;10;123 terrace st
1,Lisa,Springfield;M;8;123 terrace st
您可以使用正则表达式[,;]
来匹配任一
import pandas as pd
pd.read_csv('example.csv', sep='[,;]')
[如果csv文件扩展名有误导性——实际上不是"逗号分隔的值",而是分号分隔的,则可以使用sep=';'
]
但是要注意像注释列这样的行,这些行的值可能包含;
,而不是分隔符:bart's smart; doesn't apply himself