熊猫用分隔符将每一行分成两列(5GB CSV)



相对较新,尝试使用python从CSV文件中分割一些数据。我的数据结构如下:

Time| Signature
--------------------
0   | Class1#Method1
1   | Class4#Method5
2   | Class5# <--note that Class 5 has no method

我试图完成的是操作数据集,使其成为

Time| Class  | Method
--------------------
0   | Class1 | Method1
1   | Class4 | Method5

类5在拆分过程中被删除,因为它没有方法。

我尝试过对整个数据集进行迭代,但在处理5gb csv文件时速度非常慢。有人有更快的方法吗?速度是的一切

您可能可以使用类似df[['Class','Method']] = df['Signature'].str.split('#',expand=True)的东西

(通过分隔符pandas-python拆分列(

最新更新