我需要在Python中提取pdf注释。我所有的搜索都表明我需要Poppler来做这个,例如运行这个
但是我在安装Poppler时遇到了很多麻烦。我在OS X (Yosemite)上使用Python 3.4。以下是我到目前为止所做的尝试:
1. 皮普
pip3 install python-poppler-qt4
给出
ImportError: No module named 'sipdistutils'
2。接下来我尝试
pip3 install pypoppler
和
NameError: name 'file' is not defined
3。接下来我试着从这里下载和1一样的错误。我搜索了sidistutils,发现了这个,我想可能就是这个。我把它复制到文件夹里,又试了一次。这次我得到了
File "/python-poppler-qt4-0.24.0/sipdistutils.py", line 32
raise RuntimeError, "cannot parse SIP-generated '%s'" % sbf
4。接下来,我尝试从这里下载并使用。/configure构建,它给出了:
checking for PYPOPPLER... configure: error: Package requirements ( pygtk-2.0 >= 2.10.0,
atk >= 1.6.0,
poppler-glib >= 0.12
) were not met:
No package 'pygtk-2.0' found
No package 'atk' found
No package 'poppler-glib' found
Consider adjusting the PKG_CONFIG_PATH environment variable if you
installed software in a non-standard prefix.
5。Macports
sudo port install py34-poppler-qt4
Error: Failed to install poppler
Please see the log file for port poppler for details:
/opt/local/var/macports/logs/_opt_local_var_macports_sources_rsync.macports.org_release_tarballs_ports_graphics_poppler/poppler/main.log
错误:以下依赖项未安装:poppler-qt4-mac poppler qt4-mac dbus libmling lcms py34-pyqt4 dbus-python34 dbus-glib python34 python3_select py34-sip
我觉得我非常接近这些方法中的几个-并且非常小的东西可以解决这个问题。
以下内容仍然有效(2019年10月)
brew install poppler
安装Homebrew并在终端中粘贴poppler的收据对我有效。os x塞拉
简短回答
使用conda:conda install poppler
长回答
根据我的经验,conda
是安装具有外部(非Python)依赖的Python包的最佳解决方案。安装conda有两种选择,一种是完整的Anaconda发行版,另一种是极简的Miniconda实用程序。我更喜欢Miniconda,它可以通过运行Bash脚本安装,在这里找到:
Miniconda Mac OSX installer
安装Miniconda后,您通常创建一个新环境,然后激活它,例如:
conda create --name py37 python=3.7
conda activate py37
那么你可以使用conda
在活动Conda环境中安装软件包,例如安装poppler
:
conda install poppler
您也可以使用pip
安装软件包,例如安装pdftotext
-一个依赖于poppler
的软件包:
pip install pdftotext
安装在pycharm/setting/interpreter/available packages中对我(2021-08)有效,所以可能安装在Anaconda包管理中也有效,但我没有尝试后者。