当我尝试从任何RSS提要(使用通用提要解析器)获取日期时,我有以下代码可以很好地工作:
for entry in RSS_FEED.entries:
FEED_DATE=entry.updated_parsed
FEED_DATE_STRING = datetime.fromtimestamp(mktime(FEED_DATE))
FEED_DATE_STRING = str(FEED_DATE_STRING)
FEED_DATE_STRING = Datetime.ParseDate(FEED_DATE_STRING).strftime('%a %b %d, %Y')
但是在解析以下RSS格式时:
<item>
<title>Title</title>
<description>
Description
</description>
<lastBuildDate>Wed, 5 Oct 2011 03:11:00:00 +0700</lastBuildDate>
<pubDate>Wed, 5 Oct 2011 03:11:00:00 +0700</pubDate>
</item>
我在日志文件中得到错误:
FEED_DATE_STRING = datetime.fromtimestamp(mktime(FEED_DATE))TypeError:参数必须是9项序列,而不是None
假设您正在使用feedparser包来解析rss:日志文件中出现错误的原因是您使用了feedparser无法理解的日期格式。这意味着entry.updated_parsed
将被设置为None
。问题似乎出在时间字段的第四个元素上。如果日期更改为:
Wed, 5 Oct 2011 03:11:00 +0700