我正在尝试在Python中使用lark parser来解析一些sql字符串。某些语句中包含 unicode 字符,导致解析器抛出错误(带有 ó,é 的字符串(。 我使用以下行在我的 .lark 文件中定义字符串
LATIN_LETTER: /[u"u00a1-u02af"]/
STRING: (LATIN_LETTER|LETTER|DIGIT|PUNCTUATION)+
抛出错误
E UnexpectedCharacters: No terminal defined for '�' at line 154 col 126
E
E jillo', 'Owner', 'Avda. de la Constitución 2222', 'México D.F.', NULL, '05021'
我在 .lark 文件中指定了不正确的 unicode 字母吗?正确的方法是什么?
更改
LATIN_LETTER: /[u"u00a1-u02af"]/
自
LATIN_LETTER: ("¡".."ʯ")
工作
CHINESE_LETTER: ("u4e00".."u9fff") | ("u3000".."u303f")