从标题熊猫中提取大写



我有一个数据集,其中的列看起来像这样:

col
AMPCO Impact Socket
MEGGAR HARLEY Impact Socket

是否有任何方法可以使我能够提取AMPCO, MEGGAR HARLEY?即使我能从第二句中得到MEGGAR,那也可以。

我尝试了res = list(filter(lambda c: c.isupper(), test_str[:1]))和许多其他方法,但我没有得到我想要的

使用Series.str.findallSeries.str.join:

df['new'] = df['col'].str.findall(r'b[A-Z]+b').str.join(' ')
print (df)
col            new
0              AMPCO Impact Socket          AMPCO
1      MEGGAR HARLEY Impact Socket  MEGGAR HARLEY

最新更新