如何使用python或任何其他来源从pdf获取"Fast Web View"属性值?



是否有一种方法可以通过编程方式提取Fast Web View属性值?Python将是首选。

谢谢Manohar

使用您喜欢的本机操作系统bash(grep(或cmd控制台(find(

我不得不下载一个已知的Adobe示例文件https://github.com/adobe/pdf-embed-api-samples/tree/master/More%20Samples/Linearization因为我的数百个测试PDF下载都不是通过网络提供的。

这是Windows版本。

for /r %f in (*.pdf) do @type "%f" | find "/Linearized">nul && echo Found web view in "%f"

结果

Found web view in "C:UsersWDAGUtilityAccountDownloadsBodea Brochure - linear copy.pdf"

使用一组更大的PDF,我得到了2432个PDF中335个的返回列表,包括重复列表,因此在这种情况下不到15%。

最新更新