Python regex匹配关键字前的n个字符



我有一个像这样的数据框列

data
Membership 1 year
Individual - 10 years:
Membership 2019-2024

我想提取关键字'year'之前的数字。我想要得到输出:

data                      contract_years
Membership 1 year         1
Individual - 10 years:    10
Membership 2019-2024

我试过了d{2}+(?=year)显然是错的。任何建议都会很有帮助,谢谢。

df['contract_years'] = df['data'].str.extract('(d+) year')

`(d+)[ ]*[yY][eE][aA][rR][sS]?`

试试这个,我使用d+来获得数字,[ ]*[yY][eE][aA][rR][sS]?来知道是否有一年或几年前,不管它是大写的还是小写的,以及单词前面有多少个空格。

最新更新