我正在寻找一种方法来过滤字母列表上的数据帧。我希望我的输出数据帧是原始数据帧中的单词,不包含列表中的任何字母
例如
letter_list = ['a','d','o','m','s']
>>>df
ID WORD
1 'yellow'
2 'orange'
3 'green'
4 'blue'
5 'red'
>>> expected output
ID WORD
3 'green'
4 'blue'
我不知道这个该怎么办
感谢的帮助
使用带连接字母的Series.str.contains
和用于正则表达式的|
or
通过匹配值进行筛选,并添加~
通过反向掩码进行筛选,因此获得不匹配的行:
df = df[~df['WORD'].str.contains('|'.join(letter_list))]
print (df)
ID WORD
2 3 'green'
3 4 'blue'