几周前,我们的用户指出一些大型OCRed PDF(ABBYY生成)加载速度非常慢,并要求我们对其进行一些优化。
经过一番调查,问题似乎是由PDF中嵌入的复杂文本引起的。我尝试了不同的脚本来优化PDF,如ghostscript、qpdf等。
我发现唯一一个有显著改进的是使用带有-passfonts选项的pdftops(来自poppler),并使用ghostscript ps2pdf:pdftops-passfonts intput.PDF output.ps&;ps2pdf output.ps output.pdf.
然而,问题是我不知道passfont如何使PDF加载更快,以及它是否会产生我不知道的副作用。。。
那么,PDF大师们能阐明这种优化背后的原因/逻辑吗?
提前感谢大家!!Jeffrey
来自http://linux.die.net/man/1/pdftops
-密码字体
默认情况下,对PDF文件中未嵌入的8位字体的引用被最接近的"8位"替换;Helvetica"Times Roman";,或";信使";字体。此选项将对非嵌入字体的引用传递到PostScript文件
当文件打开时,阅读器将在系统中查找非嵌入字体,并在找到它们时加载它们。非嵌入式字体越多,需要进行的检查就越多。有时由于法律原因没有嵌入字体,有时由于文件大小不成比例以及其他各种原因而没有嵌入字体。通过用更常见的字体替换非嵌入式字体,我想说你正在迫使PDF加载更少数量的字体,并可能迫使PDF使用内存足迹较小的字体,从而加快加载时间。
比较前后的字体列表。也许这会带来更多的启示。如果您在Adobe Acrobat中打开文档:文件->属性->字体
字体替换要小心!它可能会完全破坏文档的外观和感觉。