将PDF转换为HTML
我正在尝试从PDF提取表格数据,并且为了开始,我的第一步是将PDF转换为HTML DOC。如何使用 PDF2DOM库?
您可以使用此
转换它private void generateHTMLFromPDF(String filename) {
PDDocument pdf = PDDocument.load(new File(filename));
Writer output = new PrintWriter("src/output/pdf.html", "utf-8");
new PDFDomTree().writeText(pdf, output);
output.close();
}
参考 - 链接