使用feedparser获取流数据



我正在尝试解析如下提要:

feed1 = 'http://earthquake.usgs.gov/earthquakes/feed/v1.0/summary/all_hour.geojson'
feed2 = 'http://developer.usa.gov/1usagov'

我可以使用feedparser模块解析第一个提要,但不能解析第二个提要。

import feedparser
feed1_read = feedparser.parse(feed1) # doesn't hang
feed2_read = feedparser.parse(feed2) # hangs

是否有什么我不明白这些饲料是如何工作的?为什么feedparser挂在第二个提要上,而不是第一个提要上?

feedparser实际上无法解析这些提要。feedparser模块用于解析Atom和RSS提要,它们都是XML文档格式,而这两种提要都返回JSON文档。

来电后:

feed1_read = feedparser.parse(feed1) # doesn't hang

你会发现feed1_read['feed']是空的:

>>> feed1_read['feed']
{}

也:

>>> feed1_read['bozo_exception']
SAXParseException('Document is emptyn',)

最新更新