识别彼此相邻的无限'{' expr '}'的语法

我正在使用ANTLR4编写一个c#应用程序来识别以下TeX'ish风格:

{一}{x} + {b} {y} + {c}

我当前的语法总是取'{' expr '}'的最后一个实例，然后忽略字符串的开始。下面是当前语法的一些输出结果(如下所述):

{一}输出:的(通过)
{一}+ {x} 输出: + x (通过)
{一}{x} 输出: x (失败)期望: ax
{一}{x} + {b} 输出: x + b (失败)期望: ax + b
{一}{x} + {b} {y} 输出: y (失败)期望: ax + by
{一}{x} + {b} {y} + {c} 输出: y + c (失败)期望: ax + by + c
{一}{x} + {b} {y} + c {} {d} 输出: d (失败)期望: ax + by + cd

有什么办法解决这个问题吗?

语法MyGra。g4文件:

/*
 * Parser Rules
 */
prog: expr+ ;
expr : '{' expr '}'                 # CB_Expr
     | expr op=('+'|'-') expr       # AddSub
     | '{' ID '}'                   # CB_ID
     | ID                           # ID
     ;
/*
 * Lexer Rules
 */
ID: ('a' .. 'z' | 'A' .. 'Z')+;
ADD : '+';
SUB : '-';
WS:   (' ' | 'r' | 'n') -> channel(HIDDEN);

MyGraVisitor.CS文件:

 public override string VisitID(MyGraParser.IDContext context)
 {
      return context.ID().GetText();
 }
 public override string VisitAddSub(MyGraParser.AddSubContext context)
 {
     if (context.op.Type == MyGraParser.ADD)
     {
         return Visit(context.expr(0)) + " + " + Visit(context.expr(1));
     }
     else
     {
         return Visit(context.expr(0)) + " - " + Visit(context.expr(1));
     }
 }
 public override string VisitCB_Expr(MyGraParser.CB_ExprContext context)
 {
     return Visit(context.expr());
 }
 public override string VisitCB_ID(MyGraParser.CB_IDContext context)
 {
     return context.ID().GetText();
 }

Update # 1:

建议为

添加一个语法规则

'{' expr '}{' expr '}'

然而，如果我有{a}{b}{c}{d}+{e}{f}{g}，我认为语法应该通过解析树解释递归版本的"自身"……那么如果我有1000个{expr}挨个呢?那么我需要多少条规则呢?我认为这个建议是有效的，除了我不确定如何解释相邻的无限数量的{expr} ?

我的另一个问题是:我如何重用规则CB_Expr?

更新# 2:

我添加了规则:

| expr CB_Expr                  # CB_Expr2

与参观者:

public override string VisitCB_Expr2(MyGra.CB_Expr2Context context)
{
    return Visit(context.expr()) + Visit(context.CB_Expr());
}

这没有帮助，对于所有情况我仍然得到相同的输出(如上所述)。

你的语法有歧义。例如:输入{x}可以有两个不同的解析树(如Mephy所说):

(CB_Expr {(expr (ID x))})

和

(DB_ID {x})

删除CB_ID将修复这个问题，而不会实际做任何负面的事情。

对于您的实际问题，这应该可以解决expr的问题:

expr : left=id_expr op=('+' |'-') right=expr #AddSub
     | id_expr                               #ID_Expr
     ;
id_expr :
     | '{' ID '}' id_expr                    #ID_Ex
     | '{' ID '}'                            #ID
     ;

我还没有测试过这个，我也没有给你写任何访客，但是语法应该是有效的。

id_expr规则递归地工作，因此您应该能够在每个{ID}后面放置尽可能多的{ID} -尽管至少有一个，但语法现在是这样的。

Update # 1:

更新# 2:

相关内容

最新更新

热门标签：