小贝子编程

我应该使用Parse::RecDescent或Regexp::Grammars从文档中提取表吗?

本文关键字：提取文档 Regexp Parse RecDescent 我应该 Grammars perl regexp-grammars parse-recdescent
更新时间 : 2023-08-25
英文 : Should I use Parse::RecDescent or Regexp::Grammars to extract tables from documents?

我有很多大的纯文本文档，我希望用perl解析。每个文档中大部分都有英文段落，每个文档中有几个纯文本标记的表格。

我已经创建了一个语法来描述表结构，但我不确定是否最好使用Parse::RecDescent或Regexp::Grammars来提取表。

我最初倾向于Parse::RecDescent，但我不确定在语法中如何处理我想要忽略的90%的文档文本，以便找到我想要提取的一对表埋藏在每个文档中。

也许我需要Regexp::Grammars，所以我可以"拉"我的表达式通过文档，直到它找到匹配?

谢谢

Regexp::Grammars正是我想要的，因为它允许您在文档中查找语法，并像正则表达式一样查找匹配项。Parse::RecDescent似乎不适合扫描文档并只查找与语法匹配的文本。

相关内容