首先,我已经阅读了以下类似问题的解决方案: Q1 Q2 Q3
我仍然不明白为什么我会收到以下消息:
line 1:0 missing 'PROGRAM' at 'PROGRAM'
当我尝试匹配以下内容时:
PROGRAM test
BEGIN
END
我的语法:
grammar Wengo;
program : PROGRAM id BEGIN pgm_body END ;
id : IDENTIFIER ;
pgm_body : decl func_declarations ;
decl : string_decl decl | var_decl decl | empty ;
string_decl : STRING id ASSIGN str SEMICOLON ;
str : STRINGLITERAL ;
var_decl : var_type id_list SEMICOLON ;
var_type : FLOAT | INT ;
any_type : var_type | VOID ;
id_list : id id_tail ;
id_tail : COMA id id_tail | empty ;
param_decl_list : param_decl param_decl_tail | empty ;
param_decl : var_type id ;
param_decl_tail : COMA param_decl param_decl_tail | empty ;
func_declarations : func_decl func_declarations | empty ;
func_decl : FUNCTION any_type id (param_decl_list) BEGIN func_body END ;
func_body : decl stmt_list ;
stmt_list : stmt stmt_list | empty ;
stmt : base_stmt | if_stmt | loop_stmt ;
base_stmt : assign_stmt | read_stmt | write_stmt | control_stmt ;
assign_stmt : assign_expr SEMICOLON ;
assign_expr : id ASSIGN expr ;
read_stmt : READ ( id_list )SEMICOLON ;
write_stmt : WRITE ( id_list )SEMICOLON ;
return_stmt : RETURN expr SEMICOLON ;
expr : expr_prefix factor ;
expr_prefix : expr_prefix factor addop | empty ;
factor : factor_prefix postfix_expr ;
factor_prefix : factor_prefix postfix_expr mulop | empty ;
postfix_expr : primary | call_expr ;
call_expr : id ( expr_list ) ;
expr_list : expr expr_list_tail | empty ;
expr_list_tail : COMA expr expr_list_tail | empty ;
primary : ( expr ) | id | INTLITERAL | FLOATLITERAL ;
addop : ADD | MIN ;
mulop : MUL | DIV ;
if_stmt : IF ( cond ) decl stmt_list else_part ENDIF ;
else_part : ELSE decl stmt_list | empty ;
cond : expr compop expr | TRUE | FALSE ;
compop : LESS | GREAT | EQUAL | NOTEQUAL | LESSEQ | GREATEQ ;
while_stmt : WHILE ( cond ) decl stmt_list ENDWHILE ;
control_stmt : return_stmt | CONTINUE SEMICOLON | BREAK SEMICOLON ;
loop_stmt : while_stmt | for_stmt ;
init_stmt : assign_expr | empty ;
incr_stmt : assign_expr | empty ;
for_stmt : FOR ( init_stmt SEMICOLON cond SEMICOLON incr_stmt ) decl stmt_list ENDFOR ;
COMMENT : '--' ~[rn]* -> skip ;
WS : [ trn]+ -> skip ;
NEWLINE : [ n] ;
EMPTY : $ ;
KEYWORD : PROGRAM|BEGIN|END|FUNCTION|READ|WRITE|IF|ELSE|ENDIF|WHILE|ENDWHILE|RETURN|INT|VOID|STRING|FLOAT|TRUE|FALSE|FOR|ENDFOR|CONTINUE|BREAK ;
OPERATOR : ASSIGN|ADD|MIN|MUL|DIV|EQUAL|NOTEQUAL|LESS|GREAT|LBRACKET|RBRACKET|SEMICOLON|COMA|LESSEQ|GREATEQ ;
IDENTIFIER : [a-zA-Z][a-zA-Z0-9]* ;
INTLITERAL : [0-9]+ ;
FLOATLITERAL : [0-9]*'.'[0-9]+ ;
STRINGLITERAL : '"' (~[rn"] | '""')* '"' ;
PROGRAM : 'PROGRAM';
BEGIN : 'BEGIN';
END : 'END';
FUNCTION : 'FUNCTION';
READ : 'READ';
WRITE : 'WRITE';
IF : 'IF';
ELSE : 'ELSE';
ENDIF : 'ENDIF';
WHILE : 'WHILE';
ENDWHILE : 'ENDWHILE';
RETURN : 'RETURN';
INT : 'INT';
VOID : 'VOID';
STRING : 'STRING';
FLOAT : 'FLOAT' ;
TRUE : 'TRUE';
FALSE : 'FALSE';
FOR : 'FOR';
ENDFOR : 'ENDFOR';
CONTINUE : 'CONTINUE';
BREAK : 'BREAK';
ASSIGN : ':=';
ADD : '+';
MIN : '-';
MUL : '*';
DIV : '/';
EQUAL : '=';
NOTEQUAL : '!=';
LESS : '<';
GREAT : '>';
LBRACKET : '(';
RBRACKET : ')';
SEMICOLON : ';';
COMA : ',';
LESSEQ : '<=';
GREATEQ : '>=';
从我所读到的内容来看,我认为关键字和程序之间存在不匹配,但是完全删除关键字并不能解决问题。
编辑: 删除关键字会给出以下消息:
line 3:0 mismatched input 'END' expecting {'INT', 'STRING', 'FLOAT', '+'}
当关键字可用时,这是我的grun输出:
[@0,0:6='PROGRAM',<KEYWORD>,1:0]
[@1,8:11='test',<IDENTIFIER>,1:8]
[@2,13:17='BEGIN',<KEYWORD>,2:0]
[@3,19:21='END',<KEYWORD>,3:0]
[@4,23:22='<EOF>',<EOF>,4:0]
line 1:0 mismatched input 'PROGRAM' expecting 'PROGRAM'
(program PROGRAM test BEGIN END)
这是删除关键字时的输出:
[@0,0:6='PROGRAM',<'PROGRAM'>,1:0]
[@1,8:11='test',<IDENTIFIER>,1:8]
[@2,13:17='BEGIN',<'BEGIN'>,2:0]
[@3,19:21='END',<'END'>,3:0]
[@4,23:22='<EOF>',<EOF>,4:0]
line 3:0 mismatched input 'END' expecting {'INT', 'STRING', 'FLOAT', '+'}
(program PROGRAM (id test) BEGIN (pgm_body decl func_declarations) END)
删除KEYWORD
规则时,有关"缺少'PROGRAM'"的错误已得到解决(请注意,出于同样的原因,您也应该删除OPERATOR
规则(。
您现在遇到的错误完全无关。
您当前的问题涉及empty
的定义,您没有显示。您说过您尝试了EMPTY : $ ;
和EMPTY : ^$ ;
(然后大概empty: EMPTY;
(,但这些甚至都没有编译,因此它们不会导致您发布的解析错误。无论哪种方式,EMPTY
令牌的概念都行不通。何时生成此类令牌?每隔一个令牌之间一次?在这种情况下,你会得到很多"意外EMPTY
"错误。不,empty
规则的全部意义在于它应该在不消耗任何代币的情况下成功。
为此,您只需定义empty : ;
并完全删除EMPTY
。或者,您也可以删除empty
,只使用空的替代方案(即| ;
( 您当前使用empty
的任何地方。这两种方法都可以使代码正常工作,但有更好的方法:
您使用empty
作为基本上相当于列表的规则的基本情况。ANTLR提供重复运算符*
(0或更多(,+
(1或更多(以及?
运算符,以使事物成为可选。这些允许您以非递归方式定义列表,而无需empty
规则。例如,stmt_list
可以这样定义:
stmt_list : stmt* ;
id_list
像这样:
id_list : (id (',' id)*)? ;
在不相关的说明中,通过利用ANTLR 4支持直接左递归的事实,您的语法可以大大简化,因此您可以摆脱所有不同的表达式规则,而只有一个左递归规则。
那会给你:
expr : primary
| id '(' expr_list ')'
| expr mulop expr
| expr addop expr
;
规则expr_prefix
、factor
、factor_prefix
、postfix_expr
和call_expr
都可以删除。