我正在尝试解析如下提要:
feed1 = 'http://earthquake.usgs.gov/earthquakes/feed/v1.0/summary/all_hour.geojson'
feed2 = 'http://developer.usa.gov/1usagov'
我可以使用feedparser模块解析第一个提要,但不能解析第二个提要。
import feedparser
feed1_read = feedparser.parse(feed1) # doesn't hang
feed2_read = feedparser.parse(feed2) # hangs
是否有什么我不明白这些饲料是如何工作的?为什么feedparser挂在第二个提要上,而不是第一个提要上?
feedparser
实际上无法解析或这些提要。feedparser模块用于解析Atom和RSS提要,它们都是XML文档格式,而这两种提要都返回JSON文档。
来电后:
feed1_read = feedparser.parse(feed1) # doesn't hang
你会发现feed1_read['feed']
是空的:
>>> feed1_read['feed']
{}
也:
>>> feed1_read['bozo_exception']
SAXParseException('Document is emptyn',)