我有一个单词列表搜索在数据框架与正则表达式。我试着用另一种方法来使用函数提取,而不用在括号里写所有的列表。有什么想法吗?
df["description"].str.extract("(SECTION.?dRADÔME|PROFONDEUR ET TAB|PRINCIPAL GAUCHE|PRINCIPAL DROIT|PLAN FIXE VERTICAL|PLAN FIXE HORIZONTAL|MOTEUR|KARMAN|HÉLICE|GOUVERNAIL ET TAB|CÔNE ARRIÈRE)")
我尝试使用join,但它不工作。
使用一个单词列表并创建一个用于extract的模式:
words = [r'SECTION.?dRADÔME',
'PROFONDEUR ET TAB',
'PRINCIPAL GAUCHE',
'PRINCIPAL DROIT',
'PLAN FIXE VERTICAL',
'PLAN FIXE HORIZONTAL',
'MOTEUR',
'KARMAN',
'HÉLICE',
'GOUVERNAIL ET TAB',
'CÔNE ARRIÈRE']
pattern = fr"({'|'.join(words)})"
df["description"].str.extract(pattern)