Python:如何打印正则表达式匹配的字符串



我想匹配字符串的一部分(特定单词)并打印它。这正是grep -o所做的。例如,我的单词是"黄狗",它可以在跨越多行的字符串中找到。

[34343] | ****. "Example": <one>, yellow dog
        tstring0 123
        tstring1 456
        tstring2 789

让我们试试这个正则表达式mydog = re.compile(', .*n') 然后 if mydog.search(string):仅打印匹配的单词。

如何在输出中只获得"黄狗"?

使用捕获组和查找:

>>> import re
>>> s = """[34343] | ****. "Example": <one>, yellow dog
...         tstring0 123
...         tstring1 456
...         tstring2 789"""
>>> mydog = re.compile(', (.*)n')
>>> mydog.findall(s)
['yellow dog']

如果您只想要第一场比赛,那么:

>>> mydog.findall(s)[0]
'yellow dog'

注意:您希望在s不包含匹配项时处理IndexError

如果未指定捕获组,则与整个表达式匹配的文本将包含在matchResult.group(0) 中。在您的情况下,这将是', yellow dogn'.如果只需要yellow dow,则应将捕获组添加到表达式中:, (.*?)n 。请注意,我还将.*更改为.*?,以便它不会贪婪,并在找到第一个换行符时停止。

>>> s = '''[34343] | ****. "Example": <one>, yellow dog
        tstring0 123
        tstring1 456
        tstring2 789'''
>>> mydog = re.compile(', (.*?)n')
>>> matchResult = mydog.search(s)
>>> if matchResult:
        print(matchResult.group(1))
yellow dog

最新更新