我用antlr 4.4写了一个语法,如下所示:
grammar CSV;
file
: row+ EOF
;
row
: value (Comma value)* (LineBreak | EOF)
;
value
: SimpleValueA
| QuotedValue
;
Comma
: ','
;
LineBreak
: 'r'? 'n'
| 'r'
;
SimpleValue
: ~(',' | 'r' | 'n' | '"')+
;
QuotedValue
: '"' ('""' | ~'"')* '"'
;
那么我使用antlr 4.4来生成解析器&lexer,这个过程是成功的
生成类之后,我编写了一些使用语法的java代码
import org.antlr.v4.runtime.ANTLRInputStream;
import org.antlr.v4.runtime.CommonTokenStream;
public class Main {
public static void main(String[] args)
{
String source = ""a","b","c";
CSVLexer lex = new CSVLexer(new ANTLRInputStream(source));
CommonTokenStream tokens = new CommonTokenStream(lex);
tokens.fill();
CSVParser parser = new CSVParser(tokens);
CSVParser.FileContext file = parser.file();
}
}
以上所有代码都是CSV字符串的解析器例如:"a"、"b"、"c"
窗口输出:
line 1:8 token recognition error at: '"c'
line 1:10 missing {SimpleValue, QuotedValue} at '<EOF>'
我想知道如何从方法(getErrors()或…)中获取这些错误在代码后面不是输出窗口的结果
有人能帮我吗?
使用ANTLR进行CSV解析是IMHO的核心选项,但由于您正在进行…
- 实现接口
ANTLRErrorListener
。您可以为此扩展BaseErrorListener
。收集错误并将其附加到列表中 - 调用
parser.removeErrorListeners()
删除默认侦听器 - 调用
parser.addErrorListener(yourListenerInstance)
添加您自己的侦听器 - 分析您的输入
现在,对于lexer,您可以执行相同的操作removeErrorListeners
/addErrorListener
,或者在末尾添加以下规则:
UNKNOWN_CHAR : . ;
有了这个规则,lexer将永远不会失败(当它不能做任何其他事情时,它将生成UNKNOWN_CHAR
令牌),所有错误都将由解析器生成(因为它不知道如何处理这些UNKNOWN_CHAR
令牌)。我推荐这种方法。