使用脚本拆分PDF,但不使用横向PDF



我正试图找到一个解决方案来拆分我在电子邮件中收到的PDF,以便启动OCR(发票(。该脚本运行良好,但仅适用于1-2页的文档,因此我试图找出如何管理多页PDF,并决定寻找一种代码,用一页将大PDF拆分为多个PDF。。。

我得到了这个主题:合并多个PDF';s转换为一个PDF并尝试了一些基于这个脚本的东西:链接@pokyCoder(484行(

结果很好,但脚本无法处理多页的横向PDF。剧本把每一张幻灯片都做成了肖像,而这些幻灯片当时读起来并不完整。

我怎样才能让剧本与风景融为一体?或者至少,如何在自动启动之前检测布局方向?

感谢任何帮助:(

由于PDF解码/编码的多个版本和复杂性,我决定采用另一种方式来获得统一的结果。。。

我仍然在使用OCR,但不是在很大的文档上。结果是由缓冲区处理,以避免一次产生过大的结果

最新更新