我有一个字符串列表,看起来像这样:
strings = ['apple', 'pear', 'grapefruit']
我有一个包含id和文本值的数据帧,像这样:
<表类>id 价值 1 葡萄柚真好吃!但是这个梨太难吃了。 2 我是苹果产品的忠实粉丝 3 敏捷的棕色狐狸跳过懒惰的狗 4 一天一个苹果,医生远离我 表类>
使用.str.findall
:
df['fruits'] = df['value'].str.findall('|'.join(strings)).str.join(', ')
df[df.fruits != '']
id value fruits
0 1 The grapefruit is delicious! But the pear tast... grapefruit, pear
1 2 I am a big fan og apple products apple
3 4 An apple a day keeps the doctor away apple