小贝子编程

转换熊猫中的数据类型并删除不必要的行

我想在文件中删除不必要的行，但我的原始数据中的数据类型被声明为对象。我尝试使用 .astype 转换它，但它似乎不起作用。

df = pd.read_csv(raw_data, header=None) 
print(df.dtypes) headers = ['random'] 
print("headersn", headers) 
df.columns = headers print(df.dtypes)

在此处输入图像描述

我只需要看起来像这样的数据：

::rc=80000000:lq=135:ct=31D2

其他一切都是不必要的。

>类型object是 Pandas 存储字符串的方式(直到最近发布的 v1，但对于您的目的来说，object类型不是问题(。当您说希望数据看起来像该行时，这取决于您必须有多具体。如果检查具有::rc=的行就足够了，那么您可以执行以下操作：

df[df.random.str.contains('::rc=')]

否则，您可以使用更复杂的正则表达式模式来准确获取所需的行。

相关内容