我可以知道如何使用 Tika 在网页中以表格形式提取数字等信息吗?蒂卡有解析器吗?
谢谢
好吧,
您可以在tika中提取网页。为此,您可以使用 apache-tika's
HTMLParser
.您将在这里获得所需的一切
好吧,您也可以使用AutoDetectParser
这将autodetect content type and extract content
. AutoDetectParser
可以检测任何类型的文件/URL,并将应用提取。
-我可以知道如何使用 Tika 在网页中以表格形式提取数字等信息吗?
-> tika提取的内容就像raw
文本。我不认为你会以表格形式得到它。