Tatsu解析器:前瞻语法在我的情况下不起作用



使用Tatsu 5.7.0 Python包。

我有一个非常简单的结构要解析。以下是文本示例:

AC 2092
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.
AC 2093
Sed ut perspiciatis unde omnis iste natus error sit voluptatem accusantium doloremque laudantium, totam rem aperiam, eaque ipsa quae ab illo inventore veritatis et quasi architecto beatae vitae dicta sunt explicabo. Nemo enim ipsam voluptatem quia voluptas sit aspernatur aut odit aut fugit, sed quia consequuntur magni dolores eos qui ratione voluptatem sequi nesciunt. Neque porro quisquam est, qui dolorem ipsum quia dolor sit amet, consectetur, adipisci velit, sed quia non numquam eius modi tempora incidunt ut labore et dolore magnam aliquam quaerat voluptatem. Ut enim ad minima veniam, quis nostrum exercitationem ullam corporis suscipit laboriosam, nisi ut aliquid ex ea commodi consequatur? Quis autem vel eum iure reprehenderit qui in ea voluptate velit esse quam nihil molestiae consequatur, vel illum qui dolorem eum fugiat quo voluptas nulla pariatur?

每个文本部分在序列"0"之前终止;AC…";或者在文本末尾。

我为Tatsu写了这个语法:

@@grammar::bulk
@@ignorecase :: True
start =  { section } + ;
section = act:att ( text:text | text:text_end ) ;
att = /(?i)ACs+d+/ ;
# the lookhead inside the regex works fine!
text = /(?s).+?(?=ACs+d+)/ ;
# does the att's lookahead not work because the pattern before is .+?
#text = /(?s).+?/ &att ;
# the last section does not have the final att    
text_end = /(?s).+/ ;

问题是如果我把前瞻条件放在";文本";regex规则,否则在使用Tatsu表达式进行前瞻时它不起作用

似乎是.+不向前看&att表达式,但会消耗所有输入。

如果我取消注释">text=/(?s(.+?/&att";它只识别具有第一att"的一个区段;2092";在文本规则中捕获其他所有内容。

有人能帮我吗?

您获得的结果与预期的一样。

此处:

text = /(?s).+?/ &att ;

pattern/regexp不知道下面的展望。

最新更新