32/40 (80%)
56/60 (93%)
数据框架中有一列包含如下统计数字
非正则表达式的方法是
df.col1.str.rsplit('(').str[1].str.rstrip(')'))
这里的逻辑是分割字符串,然后获取百分比值和它们,去掉不常见的")"字符串的一部分。这不是最优的方式,但更可读。
您可以在这里使用str.extract
:
df["percentage"] = df["percentage"].str.extract(r'(d+(?:.d+)?%)')