查询维基百科数据页面



我很难理解维基百科API。

通过处理json,我隔离了一个链接,json是我向发送请求后得到的响应http://en.wikipedia.org/w/api.php

假设我得到了以下链接,我如何访问出生日期等信息。

我在用python。我试着做

import urllib2,simplejson
search_req = urllib2.Request(direct_url_to_required_wikipedia_page)
response = urllib2.urlopen(search_req)

我试过阅读api。但是,我不知道如何从特定页面中提取数据。

尝试:

import urllib
import urllib2
import simplejson
url = 'http://en.wikipedia.org/w/api.php'
values = {'action' : 'query',
          'prop' : 'revisions',
          'titles' : 'Jennifer_Aniston',
          'rvprop' : 'content',
          'format' : 'json'}
data = urllib.urlencode(values)
req = urllib2.Request(url, data)
response = urllib2.urlopen(req)
json = response.read()

变量json是维基百科页面的json。现在,您可以使用simplejson或其他任何东西来解析它。。。

转到MediaWiki API。它更有组织性,对人类友好:-)。

您不会从API获得出生日期等信息,至少不会直接获得。你能做的最好的事情就是获取页面的代码(或呈现的HTML),并对其进行解析以获得你需要的信息。

作为一种替代方案,您可能需要查看DBpedia。

最新更新