REGEX从乳胶线解析命令-Python



我正试图解析并从加载的每一行中删除任何command(textit等…((从.tex文件或lilypond文件中的其他命令作为[clef, key, time](。

我怎么能那样做?

我尝试过的

import re
f = open('example.tex')
lines = f.readlines()
f.close()
pattern = '^\*([a-z]|[0-9])' # this is the wrong regex!!
clean = []
for line in lines:
    remove = re.match(pattern, line)
    if remove:
        clean.append(remove.group())
print(clean)

示例

输入

#!/usr/bin/latex
item More things
subitem Anything

预期输出

More things
Anything

您可以使用以下模式使用简单的正则表达式替换^\[^s]*:

python中的示例代码:

import re
p = re.compile(r"^\[^s]*", re.MULTILINE)
str = '''
item More things
subitem Anything
'''
subst = ""
print re.sub(p, subst, str)

结果是:

More things
Anything

这将起作用:

'\w+s'

它搜索反斜杠,然后搜索一个或多个字符和一个空格。

相关内容

  • 没有找到相关文章

最新更新