在我的输入中,我有一个没有被任何分隔符分隔的字符流,像这样:
input = "150001"
我想做一个解析器(使用JISON),它根据位置和长度进行标记,这应该是我的标记:
15 - system id (first 2 numbers)
0001 - order num (4 numbers after)
你能给我一些建议吗?我试着像这样添加我的标记:
%lex
%%
[0-9]{2} return "SYSTEM_ID"
[0-9]{4} return "ORDER_NUM"
lex
%%
但正如预期的那样,这是不工作的:)
是否有一些方法可以解析这种输入,即按字符长度进行解析?
您可以使用状态声明创建一个简单的解析器,并为每个规则分配一个状态。参考JISON的文档,它将更改为如下内容(注意您的词法分析器仍然不完整,因为它没有对标识符或"="执行任何操作):
%lex
%s system_id order_num
%%
/* some more logic is needed to accept identifier, then "=", each
with its own state, and beginning "system_id" state.
*/
<system_id>[0-9]{2} this.begin("order_num"); return "SYSTEM_ID"
<order_num>[0-9]{4} this.begin('INITIAL'); return "ORDER_NUM"
莱克斯% %