从字符串中提取数字,但不包括RegEx中的年份部分



我有下面的字符串,我想提取数字,但不是日期-例如2/15/2020或2/19/2020。

请注意,数字可以用,或rn或空白或任何其他字符分隔。

test_string = 'Get me data for the below rn11011rn11045rn11051rn11063rn11079 12462,13003  starting 2/15/2020 to 2/19/2020'

使用的命令:

re.compile("(d+)[rn*|nr*|,.|r*|s*]").findall(s)

预期输出:

['11011', '11045', '11051', '11063', '11079', '12462', '13003']

但是我得到下面的

['11011', '11045', '11051', '11063', '11079', '12462', '13003', '2020']

Code

import re
test = 'Get me data for the below rn11011rn11045rn11051rn11063rn11079 12462,13003  starting 2/15/2020 to 2/19/2020'
re.findall('(d{5,})'), test)

输出:

['11011', '11045', '11051', '11063', '11079', '12462', '13003']

解释

它匹配每个长度为>= 5的数字

最新更新