如何在 python 中的 lark 解析器中解析带有 unicode 字符的字符串



我正在尝试在Python中使用lark parser来解析一些sql字符串。某些语句中包含 unicode 字符,导致解析器抛出错误(带有 ó,é 的字符串(。 我使用以下行在我的 .lark 文件中定义字符串

LATIN_LETTER: /[u"u00a1-u02af"]/
STRING: (LATIN_LETTER|LETTER|DIGIT|PUNCTUATION)+

抛出错误

E   UnexpectedCharacters: No terminal defined for '�' at line 154 col 126
E   
E   jillo', 'Owner', 'Avda. de la Constitución 2222', 'México D.F.', NULL, '05021'

我在 .lark 文件中指定了不正确的 unicode 字母吗?正确的方法是什么?

更改

LATIN_LETTER: /[u"u00a1-u02af"]/

LATIN_LETTER: ("¡".."ʯ")

工作

CHINESE_LETTER: ("u4e00".."u9fff") | ("u3000".."u303f")