转换熊猫中的数据类型并删除不必要的行



我想在文件中删除不必要的行,但我的原始数据中的数据类型被声明为对象。 我尝试使用 .astype 转换它,但它似乎不起作用。

df = pd.read_csv(raw_data, header=None) 
print(df.dtypes) headers = ['random'] 
print("headersn", headers) 
df.columns = headers print(df.dtypes)

在此处输入图像描述

我只需要看起来像这样的数据:

::rc=80000000:lq=135:ct=31D2

其他一切都是不必要的。

>类型object是 Pandas 存储字符串的方式(直到最近发布的 v1,但对于您的目的来说,object类型不是问题(。当您说希望数据看起来像该行时,这取决于您必须有多具体。如果检查具有::rc=的行就足够了,那么您可以执行以下操作:

df[df.random.str.contains('::rc=')]

否则,您可以使用更复杂的正则表达式模式来准确获取所需的行。

最新更新