手册页,作为结构化数据(csv、数据库等)



为了简化我的问题,我主要考虑命令的手册页。 例如"人格雷普"。 手册页或多或少是结构化的。大多数部分及其演示文稿都是标准的,可以在 https://www.tldp.org/HOWTO/Man-Page/q3.html (而且手册页的来源,在 groff 中,并不难理解,即使不知道 groff)

我的问题是:是否已经有一个包含(更标准的)手册页的数据库。或者至少是一个程序,将手册页(可能作为 groff 文件)作为输入并输出这样的数据库。 在这里,我的意思是数据库在一个非常模糊的意义上。 Sqlite或mysql将是完美的。但是 csv 的压缩也会很棒。 让我举一个用人格勒的例子。

数据库将有一个选项表,每个选项都有一个条目。此条目将包含: - 实际选项名称 - 缩写 - 此选项的作用说明 - 封闭部分。 .在 CSV 中,条目将是 --extended-regexp, -E, 将 PATTERN 解释为扩展正则表达式(ERE\,见下文)。(-E 由 POSIX 指定),匹配器选择

它将有一个"退出"表,其中包含: 0,找到选定的行 1、否则 2 发生错误\,除非使用了 -q 或 --quiet 或 --silent 选项并找到选定的行。

对于手册页的每种标准类型的节,依此类推。 还有一个表格,其中包含未成功放入其他表格的每个文本。

我希望它的某些部分易于解析,例如创建选项表。但其他一些部分将非常困难,例如退出状态。这就是为什么我真的很想知道这样的事情是否已经做过,而不是自己做。

您可以使用 git clone http://git.kernel.org/pub/scm/docs/man-pages/man-pages

最新更新