我有一个规则来匹配语法中的字符串。我目前需要字符串的内容而不是引号本身,所以我希望去掉引号。
StringLiteral
: UnterminatedStringLiteral '"'
;
UnterminatedStringLiteral
: '"' (~["\rn] | '\' (. | EOF))*
;
我在 https://theantlrguy.atlassian.net/wiki/spaces/ANTLR3/pages/2687006/How+do+I+strip+quotes 上看到了一个解决方案,但它是旧版本的ANTLR,我需要将其转换为Python3。有人对此有解决方案吗?
ANTLR3 语法:
STRING: '"' CHARS '"' {setText(getText().substring(1, getText().length()-1));} ;
仍然适用于 ANTLR4。如果要将该 Java 代码移植到 Python,请执行以下操作:
StringLiteral
: UnterminatedStringLiteral '"' {self.text = self.text[1:-1]}
;
如果您还想剥离用于转义字符的,请执行以下操作:
grammar YourGrammarName;
@lexer::header {
import re
}
...
StringLiteral
: UnterminatedStringLiteral '"' {self.text = re.sub(r'\(.)', '\1', self.text[1:-1])}
;