相对较新,尝试使用python从CSV文件中分割一些数据。我的数据结构如下:
Time| Signature
--------------------
0 | Class1#Method1
1 | Class4#Method5
2 | Class5# <--note that Class 5 has no method
我试图完成的是操作数据集,使其成为
Time| Class | Method
--------------------
0 | Class1 | Method1
1 | Class4 | Method5
类5在拆分过程中被删除,因为它没有方法。
我尝试过对整个数据集进行迭代,但在处理5gb csv文件时速度非常慢。有人有更快的方法吗?速度是的一切
您可能可以使用类似df[['Class','Method']] = df['Signature'].str.split('#',expand=True)
的东西
(通过分隔符pandas-python拆分列(