小贝子编程

使用掩码删除熊猫 df 行，基于字符串列的最后一个字母

本文关键字：字符串最后一个掩码码删除熊猫 df python pandas mask
更新时间 : 2023-09-14
英文 : delete Pandas df row using mask, based on the last letter of a string column

例如，在下面的熊猫数据帧中，有 3 行，都是字符串。我想根据条件if str[-1] == '-':放弃

df = pd.DataFrame({'a': ["123-","123-1","123-2"]})

但如果我这样做

df[df['a'][-1]=='-']

它将返回错误。我知道可以使用df.apply函数来做到这一点。但我只是想知道它是否可以用面具来完成。

您可以使用正则表达式创建掩码，如下所示。美元符号将确保连字符仅在字符串末尾匹配。

df.a.str.contains('-$')

这将返回一个布尔序列。使用您的示例：

0     True
1    False
2    False

然后，您可以使用df.drop()像往常一样删除行：

df.drop(df[df.a.str.contains('-$')].index, inplace=True)

并重置索引，如果您愿意：

df.reset_index(inplace=True, drop=True)

相关内容