我正在尝试通过提要解析器从两个不同RSS提要中的条目中获取日期。
这是我正在做的事情:
import feedparser as fp
reddit = fp.parse("http://www.reddit.com/.rss")
cc = fp.parse("http://contentconsumer.com/feed")
print reddit.entries[0].date
print cc.entries[0].date
以下是它们的结果:
2008-10-21T22:23:28.033841+00:00
Wed, 15 Oct 2008 10:06:10 +0000
我想达到可以轻松找出哪个较新的地步。
我尝试使用 Python 的日期时间模块并搜索提要解析器文档,但我无法解决这个问题。任何帮助将不胜感激。
在野外使用 RSS 提要解析日期是一种痛苦,这就是feedparser
可以提供很大帮助的地方。
如果使用 *_parsed
属性(如 updated_parsed
),feedparser
将完成工作,并将返回 UTC 格式的 9 元组 Python 日期。
有关更多血腥细节,请参阅 http://packages.python.org/feedparser/date-parsing.html。