我想在文件中删除不必要的行,但我的原始数据中的数据类型被声明为对象。 我尝试使用 .astype 转换它,但它似乎不起作用。
df = pd.read_csv(raw_data, header=None)
print(df.dtypes) headers = ['random']
print("headersn", headers)
df.columns = headers print(df.dtypes)
在此处输入图像描述
我只需要看起来像这样的数据:
::rc=80000000:lq=135:ct=31D2
其他一切都是不必要的。
>类型object
是 Pandas 存储字符串的方式(直到最近发布的 v1,但对于您的目的来说,object
类型不是问题(。当您说希望数据看起来像该行时,这取决于您必须有多具体。如果检查具有::rc=
的行就足够了,那么您可以执行以下操作:
df[df.random.str.contains('::rc=')]
否则,您可以使用更复杂的正则表达式模式来准确获取所需的行。