我有很多大的纯文本文档,我希望用perl解析。每个文档中大部分都有英文段落,每个文档中有几个纯文本标记的表格。
我已经创建了一个语法来描述表结构,但我不确定是否最好使用Parse::RecDescent或Regexp::Grammars来提取表。
我最初倾向于Parse::RecDescent,但我不确定在语法中如何处理我想要忽略的90%的文档文本,以便找到我想要提取的一对表埋藏在每个文档中。
也许我需要Regexp::Grammars,所以我可以"拉"我的表达式通过文档,直到它找到匹配?
谢谢
Regexp::Grammars正是我想要的,因为它允许您在文档中查找语法,并像正则表达式一样查找匹配项。Parse::RecDescent似乎不适合扫描文档并只查找与语法匹配的文本。