小贝子编程

使用 Jsoup 解析一个巨大的 HTML 流

本文关键字：巨大一个 HTML Jsoup 使用 jsoup
更新时间 : 2023-09-05
英文 : Parsing a huge HTML stream with Jsoup

任何人都可以提供关于我如何处理解析非常大的HTML流/文件的指针或建议。例如，我有一个大约 270，000 行的表，我想一次将其引入我的应用程序中大约 20k。 jsoup parse 方法允许 HTML 片段，但我不清楚读取代表这个片段的 XXX 字节的最有效和最干净的方法是什么。

任何帮助，非常感谢。

如果它是 XHTML，并且您不需要一次将整个内容保存在内存中，那么更好的选择可能是使用 SAX 解析器并使用开始和结束标记事件挑选您需要的数据。

另一个想法可能是StAX解析器。

相关内容

最新更新