如何使用Python报纸库

我正在尝试制作web解析器并保存它。我找到了报纸图书馆。我正在使用Eclipse。但是我没能取得好成绩。请帮帮我。

import newspaper
cnn_paper = newspaper.build('http://cnn.com')
for article in cnn_paper.articles:
    print(article.url)

这是一个错误信息:

Traceback (most recent call last):
  File "D:workspace2JesElaSearchSysNespaperScraper_01.py", line 2, in <module>
    import newspaper
  File "C:Python27libsite-packagesnewspaper3k-0.1.5-py2.7.eggnewspaper__init__.py", line 10, i
n <module>
    from .article import Article, ArticleException
  File "C:Python27libsite-packagesnewspaper3k-0.1.5-py2.7.eggnewspaperarticle.py", line 12, in
 <module>
    from . import images
  File "C:Python27libsite-packagesnewspaper3k-0.1.5-py2.7.eggnewspaperimages.py", line 15, in 
<module>
    import urllib.request
ImportError: No module named request

您的代码没有任何问题。您需要安装或定位newspaper和request库。您的开发机器上缺少newspaper/request库。

$ pip install newspaper
$ pip install urllib3

上面的命令将帮助您安装它。

虽然已经有答案，但Python2的报纸库已被弃用，应避免使用。

Newspaper已被Python2弃用，根据他们的官方文档，这是一个错误的版本。你应该切换到Python3版本。

Python 3上的安装:

pip3 install newspaper3k

Newspaper是一个Python3库!或者，查看我们已弃用且有bug的Python2分支。执行命令pip3 install newspaper3k，不要执行命令pip3 install newspaper。在python3上，你必须安装newspaper3k，而不是newspaper。Newspaper是我们的python2库。虽然使用pip安装newspaper很简单，但是如果你试图在ubuntu上安装，你会遇到一些可修复的问题。

相关内容

最新更新

热门标签：