我正试图找到一个解决方案来拆分我在电子邮件中收到的PDF,以便启动OCR(发票(。该脚本运行良好,但仅适用于1-2页的文档,因此我试图找出如何管理多页PDF,并决定寻找一种代码,用一页将大PDF拆分为多个PDF。。。
我得到了这个主题:合并多个PDF';s转换为一个PDF并尝试了一些基于这个脚本的东西:链接@pokyCoder(484行(
结果很好,但脚本无法处理多页的横向PDF。剧本把每一张幻灯片都做成了肖像,而这些幻灯片当时读起来并不完整。
我怎样才能让剧本与风景融为一体?或者至少,如何在自动启动之前检测布局方向?
感谢任何帮助:(
由于PDF解码/编码的多个版本和复杂性,我决定采用另一种方式来获得统一的结果。。。
我仍然在使用OCR,但不是在很大的文档上。结果是由缓冲区处理,以避免一次产生过大的结果