我在过去的两天里一直在搜索这个,但很难找到。 但这里的问题是,当您在Google中使用任何单词搜索Col spans时,不同的和变体的文档将显示不相关的。
问题:是否可以使用 tika apache 解析器,从不同类型的文档中检索或获取解析的数据,其中 col spans 和行跨度为 xhtml。 如果是,是否有教程或任何文档可以帮助我。
不幸的是不是,开箱即用。
您需要扩展用于解析电子表格的基本库,以将此信息放入 Tika 输出中。
另一种方法是使用 EPPlus