假设我有以下数据帧:
ter_id shstr value
6 2018002000000 201 1740.0
7 2018002000000 201 10759.0
8 2018002000002 201 2.0
如何过滤出ter_id
最后六个符号为零的行?所需输出为:
ter_id shstr value
8 2018002000002 201 2.0
我做了一个布尔函数
def is_total(ter_id: str) -> bool:
if ter_id[:-6] == "000000":
return True
return False
但它的使用失败与错误:
dataset.filter(is_total(dataset.ter_id))
...
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
Pandas版本为1.0.1
对于基于列值过滤数据帧,很少有理由编写自己的函数。您可以将条件作为布尔掩码传递到df.loc[]中(假设您的DataFrame名为df(。
df = df.loc[df["ter_id"].str[-6:] != "000000"]
通过[-6:]
更改最后一个6
值的索引,并通过boolean indexing
:获取所有不匹配的行
df = dataset[dataset.ter_id.str[-6:] != "000000"]
print (df)
ter_id shstr value
8 2018002000002 201 2.0
IIUC
df[~(df.ter_id%1000000==0)]
Out[256]:
ter_id shstr value
8 2018002000002 201 2.0
我想到的是,首先应该将列(ter_id(转换为字符串。然后使用.包含方法对整列
df_filtered = df[~df.ter_id.str.contains("000000")].copy()
df
是您的数据帧名称。我使用copy()
函数来附加警告。如果这有帮助,请告诉我。。。。
第页。S.你可以放任何字符串而不是零。
不需要Python函数,只需使用:
dataset[dataset['ter_id'].str.slice(-6) != '000000']