python re.findall() with list



我有一个很长的字符串(例如AAAABBBCCCC),我最终想找到不同子字符串列表中的每个成员的所有重叠出现(例如['AAA','AAB','ABB','BBB'])。

我在以前的 StackOverflow 帖子中发现了一个非常有用的建议 - 字符串计数与重叠出现 但是,使用它,我似乎无法以 re.findall() 可以识别它们的方式分配子字符串。这可能是一些愚蠢的事情,但我似乎无法弄清楚。似乎?正在做与平时不同的事情......

>>> string = 'AAAABBBBCCCC'
>>> len(re.findall('(?=AAA)', string))
2
>>> substring = 'AAA'
>>> len(re.findall('(?=substring)', string))
0
>>> substring = "'(?=AAA)'"
>>> len(re.findall(substring, string))
0
>>> #This works, but is not overlapping:
>>> substring = 'AAA'
>>> len(re.findall(substring, string))
1

我将不胜感激任何建议!谢谢!

如果我理解正确,您想分配一个变量并在findall函数中使用它吗?

>>> substring = '(?=AAA)' #or "(?=AAA)"
>>> len(re.findall(substring, string))
>>> 2

看看这是否对其余的事情有帮助,您的第 5 行是字符串子字符串而不是变量子字符串。

import re
string = 'AAAABBBBCCCC'
len(re.findall('(?=AAA)', string))
2
substring = 'AAA'
len(re.findall('(?=' + substring + ')', string))
2

最新更新