使用 Apache poi 从 xlsx 读取百万条记录



我有一个 xlsx 文件,有近一百万条记录。我正在尝试使用Apache POI读取文件。但是,它会引发内存不足错误。我尝试增加 Java 堆空间,但它不能解决问题。是否有任何解决方法或替代 API 来读取如此大的文件?

是的,您必须将流式 API 用于 apache POI - 它允许您随机读取工作表行,而无需一次将整个文档提取到内存中。查看此内容以获取更多详细信息。http://poi.apache.org/spreadsheet/how-to.html#sxssf

最新更新