提卡信息提取



我可以知道如何使用 Tika 在网页中以表格形式提取数字等信息吗?蒂卡有解析器吗?

谢谢

好吧,

您可以在tika中提取网页。为此,您可以使用 apache-tika's HTMLParser .您将在这里获得所需的一切

好吧,您也可以使用AutoDetectParser这将autodetect content type and extract content. AutoDetectParser可以检测任何类型的文件/URL,并将应用提取。

我可以知道如何使用 Tika 在网页中以表格形式提取数字等信息吗?

-

-> tika提取的内容就像raw文本。我不认为你会以表格形式得到它。

相关内容

  • 没有找到相关文章

最新更新