Tika 并使用行和列跨度解析数据



我在过去的两天里一直在搜索这个,但很难找到。 但这里的问题是,当您在Google中使用任何单词搜索Col spans时,不同的和变体的文档将显示不相关的。

问题:是否可以使用 tika apache 解析器,从不同类型的文档中检索或获取解析的数据,其中 col spans 和行跨度为 xhtml。 如果是,是否有教程或任何文档可以帮助我。

不幸的是不是,开箱即用。

您需要扩展用于解析电子表格的基本库,以将此信息放入 Tika 输出中。

另一种方法是使用 EPPlus

相关内容

  • 没有找到相关文章

最新更新