我正在使用xpdf将pdf文件转换为文本。下面是用于它的代码。
$content = shell_exec('pdftotext '.$filename.' -');
Xpdf 无法将 pdf 中的一些特殊字体转换为文本。例如:奇异字体无法使用 XPDF 转换为文本。
它们是可以将pdf中的所有类型的字体转换为PHP文本的替代软件吗?
也许你应该尝试 Poppler 版本的 pdftotext
如果 XPDF 版本对你的文件失败......
但是,请注意这一事实: 即使是 Acrobat Reader 也无法将 PDF 页面上所有呈现良好的文本案例提取到文本文件中......