在 excel 数据上使用正则表达式提取多个单词



我在Excel中有一个数据集:

column1                   
Bank A : 12
Bank B : 40
Bank C : 55

其中它只包含一个单元格内包含银行 A、B 和 C 信息的单行。

我将如何使用 Python 中的正则表达式来创建 3 列,其中我的新数据集是:

Bank A     Bank B      Bank C
12          40          55

谢谢!

您可以使用以下正则表达式来执行此操作:

(.*?)s:s(d+)

正则表达式演示

或者使用此正则表达式对:前后的空格更加宽容

(.*?)(?:s+)?:(?:s+)?(d+)

正则表达式演示

解释:

(.*?)    # For Group 1, match every character
s:s    # until reaching a space + : + space
(d+)    # For Group 2, match every digit

然后,使用 python 代码,您可以使用 Match.group(( 方法访问组 1 和组 2 的内容,并根据需要构建列。

最新更新