我有一个数据集,其中的列看起来像这样:
col
AMPCO Impact Socket
MEGGAR HARLEY Impact Socket
是否有任何方法可以使我能够提取AMPCO, MEGGAR HARLEY
?即使我能从第二句中得到MEGGAR,那也可以。
我尝试了res = list(filter(lambda c: c.isupper(), test_str[:1]))
和许多其他方法,但我没有得到我想要的
使用Series.str.findall
和Series.str.join
:
df['new'] = df['col'].str.findall(r'b[A-Z]+b').str.join(' ')
print (df)
col new
0 AMPCO Impact Socket AMPCO
1 MEGGAR HARLEY Impact Socket MEGGAR HARLEY