使用pandas,如何对包含字符串元素列表中的字符串元素的所有值对表进行排序?



我有一个字符串列表,看起来像这样:

strings = ['apple', 'pear', 'grapefruit']
我有一个包含id和文本值的数据帧,像这样:
<表类>id价值1葡萄柚真好吃!但是这个梨太难吃了。2我是苹果产品的忠实粉丝3敏捷的棕色狐狸跳过懒惰的狗4一天一个苹果,医生远离我

使用.str.findall:

df['fruits'] = df['value'].str.findall('|'.join(strings)).str.join(', ')
df[df.fruits != '']
id                                              value            fruits
0   1  The grapefruit is delicious! But the pear tast...  grapefruit, pear
1   2                   I am a big fan og apple products             apple
3   4               An apple a day keeps the doctor away             apple

相关内容

  • 没有找到相关文章

最新更新