我有这样的文本
示例:"签证代码:ab c主号码:efg发现:1j k">
输出应该是这样的:abc、efg、ijk
有没有办法,我可以使用Grok模式匹配或Reg EX在":"(不考虑空间(?
您可以从以下内容开始:
>>> import re
>>> p = re.compile(r"b((?:ws*){2}w)b")
>>> re.findall(p, "visa code: ab c master number: efg discover: i j k")
['ab c', 'efg', 'i j k']
但你还有更多的工作要做。例如,没有人能猜到你所说的";字符";。
除此之外,模式匹配系统匹配字符串,但不转换它们。你必须通过其他方式删除你不想要的空间(这应该很容易(。