我有一个大pdf文件,有近95000页。它包含 12000 个语句。我需要分成单独的陈述。我使用 pdftk,但它太慢了,每 2 分钟只生成 7 个语句。你知道任何可以在命令行中运行的好软件吗?
提前谢谢你
试试 cpdf:
cpdf -split in.pdf -o %%%.pdf
将生成 001.pdf、002.pdf 等。还有其他特殊代码可以制作漂亮的输出名称。
您可以使用-chunksize n
拆分为多个页面的组。
既然你说有95000页和12000条语句,也许这些语句的长度不同。在这种情况下,您可以手动执行此操作:
cpdf in.pdf 3455-3471 -o out.pdf
将第 3455-3471 页解压缩到输出.pdf
CPdFd 可免费用于非商业用途。我们也有支持电子邮件地址。
还有一本全面的手册。
你可以相信pdfbox。它非常快速和可靠。它还具有拆分或合并pdf文档的命令行方法。非常方便!
下载提供的jar后,您可以通过以下方式完成工作
java -jar pdfbox-app-x.y.z.jar PDFSplit [OPTIONS] <PDF file>
查看以下选项链接:
http://pdfbox.apache.org/commandline/#pdfSplit
您也可以尝试一些在线工具。 http://www.pdfPi.com 使用起来也非常方便。文件大小上传限制为 100MB。
我认为您可以使用这个java应用程序:https://github.com/reinardhz/project-split-file
我自己做的是因为"拆分"应用程序太慢而无法拆分大文件。您可以使用它拆分任何文件。