我正在寻找可以在Microsoft Word中打开pdf的方法(Word ole-object(。 我想将pdf的所有页面复制到doc/docx中并在那里添加页脚。 任何人都可以给出如何导入pdf的提示吗? PS:此问题的任何示例代码都会很棒。
谢谢 莉莉亚
您需要 OCR(光学字符识别(引擎来将 PDF 转换为文档。PDF是通用格式,它可以包含文本作为图像。因此,很难将PDF转换为文档。SAP没有任何OCR功能来做到这一点。也许OpenText(如果客户使用它(具有此功能,我还没有获得有关opentext的详细信息。为此,您需要第三方工具。如果PDF包含文本,您可以使用在线服务或命令行实用程序轻松地将PDF文件转换为文本文件,否则您需要专业的SDK(例如Abbyy Finereader(来执行此操作。
我使用FoxIT PDF Reader将PDF文件保存到文本文件中,并制作一个宏来读取文本文件。当然,通过这样做,您只能获得文本,而不能获得其他内容。