在括号之间保留数字并删除其余部分



数据框架中有一列包含如下统计数字

32/40 (80%) 56/60 (93%)

非正则表达式的方法是

df.col1.str.rsplit('(').str[1].str.rstrip(')'))

这里的逻辑是分割字符串,然后获取百分比值和它们,去掉不常见的")"字符串的一部分。这不是最优的方式,但更可读。

您可以在这里使用str.extract:

df["percentage"] = df["percentage"].str.extract(r'(d+(?:.d+)?%)')

相关内容

  • 没有找到相关文章

最新更新