ScraperWiki的最新版本依赖于Poppler(GitHub是这么说的)。不幸的是,它只指定了如何在macOS和Linux上获得它,而不是Windows。
快速的谷歌搜索没有发现什么太有希望的东西。有人知道如何在ScraperWiki的Windows上获得Poppler吗?
其他答案已链接到适用于Windows用户的正确下载页面,但未指定如何为未入门用户安装。
-
转到此页面并下载您选择的二进制文件。在本例中,我们将下载并使用
poppler-0.68.0_x86
。 -
将存档文件
poppler-0.68.0_x86.7z
提取到C:Program Files
中。因此,目录结构应该是这样的:
C:
└ Program Files
└ poppler-0.68.0_x86
└ bin
└ include
└ lib
└ share
通过以下操作将
C:Program Filespoppler-0.68.0_x86bin
添加到您的系统PATH
:单击Windows启动按钮,搜索Edit the system environment variables
,单击Environment Variables...
,在System variables
下,查找并双击PATH
,单击New
,然后添加C:UsersProgram Filespoppler-0.68.0_x86bin
,然后单击OK
。如果您正在使用终端执行poppler(例如在命令行中运行
pdf2image
),则可能需要重新打开终端以使poppler工作。完成!
下载Poppler Packaged for Windows
https://github.com/oschwartz10612/poppler-windows/releases
我把最新的Poppler预构建的二进制文件与Windows的依赖项打包在一起,进行了快速回购。借助conda锻造厂和poppler原料建造。包括最新的poppler数据。
Poppler Windows二进制文件可从ftp://ftp.gnome.org/Public/GNOME/binaries/win32/dependencies/——但请注意,这些并不是最新的。
如果您正在寻找Python(2.7)绑定(正如这个问题的标签所示),我过去曾通过这个错误报告请求过它们。显然有几个人成功地生产了一些东西,但我还没有检查出来。
至于最近的(与python绑定无关)poppler Windows二进制文件Google结果,请参阅http://blog.alivate.com.au/poppler-windows/
最后,还有一个全新的(目前更新非常频繁)PyGObject一体式安装程序(主要旨在为Windows提供PyGObjectinstrospected Gtk+3 Python绑定等),所以如果这是你想要的,请访问http://sourceforge.net/projects/pygobjectwin32/files/?source=navbar
在windows上安装anaconda后,可以简单地执行:
conda install -c conda-forge poppler
更新2
请参阅Owen Schwartz的答案。
更新1
Rumpel Stielzchen的评论:
此网站不再维护。Poppler版本0.68非常今天已经过时了。您可以找到同样为Windows编译的最新版本此处:https://anaconda.org/conda-forge/poppler/files遗憾的是没有32位版本,仅64位
…但此包不包含依赖项:
Anaconda人似乎有一个下载软件包的工具以及所有依赖关系。TAR包中有一个文件:index.json,它列出了它所依赖的包。我下载了一个接一个的依赖关系,是的:这很痛苦。
原始答案
最新的Poppler Windows二进制文件可以在这里找到:
http://blog.alivate.com.au/poppler-windows/
巧克力
Poppler有巧克力包装:
choco install poppler
默认情况下,Poppler安装在C:ProgramDatachocolateylibpoppler
中,并自动为以下工具创建垫片:pdfdetach
、pdffonts
、pdfimages
、pdfinfo
、pdfseparate
、pdftocairo
、pdftohtml
、pdftoppm
、pdftops
、pdftotext
、pdfunite
。
要更新Poppler,请运行:
cup poppler
Scoop
从主铲斗安装:
scoop install poppler
默认情况下,Poppler安装在~scoopappspoppler
中,并自动为以下工具创建垫片:pdfdetach
、pdffonts
、pdfimages
、pdfinfo
、pdfseparate
、pdftocairo
、pdftohtml
、pdftoppm
、pdftops
、pdftotext
、pdfunite
。
要更新Poppler,请运行:
scoop update poppler
TeX Live
正如另一个答案中所提到的,MiKTeX目前附带Poppler工具,LaTeX的另一个发行版TeX Live也是如此。来自指南:
命令行工具。
一些常见Unix命令行程序的Windows端口与常见的TeX Live二进制文件一起安装。其中包括
gzip
、zip
、unzip
和poppler套件中的实用程序(pdfinfo
、pdffonts
…)
Poppler套件默认位于C:texlive<year>binwin32
中,如果您可以编译LaTeX文档,则应该可以开箱即用,因为该位置是由安装程序添加到PATH中的。
要在Windows上简单安装Poppler,请在不接触环境变量的情况下运行以下步骤。
- 从URL下载最新的Poppler二进制文件:http://blog.alivate.com.au/poppler-windows/index.html
- 解压缩并将poppler-0.68.0_x86文件夹复制到ex的某个路径中,C:\User/poppler/poppler--0.68.0_x86/poppler-0.680.0/bin
现在转到您想要调用Poppler进行图像转换的Python代码,并使用下面提到的代码片段:
from pdf2image import convert_from_path
pages = convert_from_path('MyPdf.pdf', 500, poppler_path = r'C:UserPopplerpoppler-0.68.0_x86poppler-0.68.0bin')
for page in pages:
page.save('out.jpg', 'JPEG')
您应该考虑使用Windows Subsystem for Linux(WSL)。
- 在Windows 10上启用WSL(在S版上不起作用)
- 从Windows应用商店在WSL上安装Ubuntu(最新版本)
- 打开Ubuntu命令行
在Ubuntu命令行中,运行以下命令:
sudo apt-get update
sudo apt-get upgrade
sudo apt install poppler-utils
pdftocairo -v
-检查已安装的版本
然后可以通过两种方式运行pdftocairo(例如):
- 在Ubuntu命令行中:
pdftocairo ...
- 直接从Windows命令行:
wsl pdftocairo...
注意:每个Ubuntu版本都有一个poppler的默认版本。你需要查找说明(互联网上应该有很多),了解如何在Ubuntu上安装最新版本的poppler utils。这可能涉及相当多的步骤,这些步骤将从源代码进行编译。例如,像这样的东西https://askubuntu.com/a/722955.然后你可能会遇到很多问题。
最新版本的Ubuntu 19.04,可以安装Poppler 74。但是Ubuntu 18.04似乎是目前可以为WSL安装的最新版本,它安装了Poppler 62。
这里可以找到一个可以使用visual studio构建的版本https://bitbucket.org/merarischroeder/poppler-for-windows/overview
在Windows上安装Poppler
- 转到https://github.com/oschwartz10612/poppler-windows/releases/
- 正在发布21.11.0-0最新版本21.11.0-0
- 转到资产3下载
- 版本-21.11.0-0.zip
将Poppler添加到路径
- 将已安装的Poppler添加到操作:C:\Users\UserName\Downloads\Release-21.11.0-0.zip
- 将C:\Users\UserName\Downloads\Release-21.11.0-0.zip添加到环境变量中的系统变量路径
另一个选项是,如果您已经安装了MikTeX,那么poppler在默认情况下会包含在内,并且可能已经在您的PATH
中了。在我的案例中,二进制文件安装在以下位置:C:Program FilesMiKTeX 2.9miktexbinx64
MSYS2有最新版本可供安装。
如果你不想安装整个环境(或者你想要某种可移植版本),你也可以直接从存储库下载Poppler,但你也必须手动处理依赖关系。即:libwinpthread
、nspr
、gcc-libs
、nss
、curl
、brotli
、openssl
、libidn2
、libiconv
、gettext
、libunistring
、nghttp2
、libpsl
、libjpeg-turbo
、lcms2
、openjpeg2
、libpng
、zlib
、libtiff
、xz
和zstd
。
-
安装Microsoft Visual C++构建工具
-
通过Conda提示符安装poppler Conda:
conda install-c conda forge poppler
请注意:如果您没有安装anaconda,可以从这里下载,https://docs.anaconda.com/anaconda/install/windows/
可以在此处找到适用于Windows x64、Mac OSX-64、Linux 64位的最新二进制文件
https://anaconda.org/conda-forge/poppler/files
截至本文撰写之时,Poppler 0.84版本可在链接中获得,这是非常新的。阿列克谢给出的公认答案和链接不再指向当前版本的poppler
更新:截至2021年3月8日,Owen Schwarz给出了最佳答案https://stackoverflow.com/a/62615998/590388
这就是我所做的。
- 安装msys2
- 打开msys2 shell,然后运行:
pacman -Suy
pacman -S mingw-w64-x86_64-poppler
Poppler二进制文件安装在C:msys64mingw64bin