如何将正则表达式应用于panda中的拆分列



我有一个列,字符串如下所示:

Accommodation and food services [72]
Wholesale trade [41]
Trade [41-45N]

括号内的字符串没有模式,我想把它分为两列,一列是行业名称,另一列是产业id(括号内的信息(。我试了很多方法,但都没用。提前谢谢。

[output] columnA:                                  columnB:
Accommodation and food services           [72]
Wholesale trade                           [41]
Trade                                     [41-45N]

让我们执行rsplit

newdf=df['col'].str.rsplit(' ', n=1, expand=True)

您可以尝试:

pat = '^(.*) ([.*])$'
df['strCol'].str.extract(pat)

最新更新