我正在尝试制作web解析器并保存它。我找到了报纸图书馆。我正在使用Eclipse。但是我没能取得好成绩。请帮帮我。
import newspaper
cnn_paper = newspaper.build('http://cnn.com')
for article in cnn_paper.articles:
print(article.url)
这是一个错误信息:
Traceback (most recent call last):
File "D:workspace2JesElaSearchSysNespaperScraper_01.py", line 2, in <module>
import newspaper
File "C:Python27libsite-packagesnewspaper3k-0.1.5-py2.7.eggnewspaper__init__.py", line 10, i
n <module>
from .article import Article, ArticleException
File "C:Python27libsite-packagesnewspaper3k-0.1.5-py2.7.eggnewspaperarticle.py", line 12, in
<module>
from . import images
File "C:Python27libsite-packagesnewspaper3k-0.1.5-py2.7.eggnewspaperimages.py", line 15, in
<module>
import urllib.request
ImportError: No module named request
您的代码没有任何问题。您需要安装或定位newspaper
和request
库。您的开发机器上缺少newspaper
/request
库。
$ pip install newspaper
$ pip install urllib3
上面的命令将帮助您安装它。
虽然已经有答案,但Python2的报纸库已被弃用,应避免使用。
Newspaper已被Python2弃用,根据他们的官方文档,这是一个错误的版本。你应该切换到Python3版本。
Python 3上的安装:
pip3 install newspaper3k
Newspaper是一个Python3库!或者,查看我们已弃用且有bug的Python2分支。执行命令pip3 install newspaper3k,不要执行命令pip3 install newspaper。在python3上,你必须安装newspaper3k,而不是newspaper。Newspaper是我们的python2库。虽然使用pip安装newspaper很简单,但是如果你试图在ubuntu上安装,你会遇到一些可修复的问题。