在使用python从RSS获取更新日期时获取NoneType



当我尝试从任何RSS提要(使用通用提要解析器)获取日期时,我有以下代码可以很好地工作:

for entry in RSS_FEED.entries:
    FEED_DATE=entry.updated_parsed
    FEED_DATE_STRING = datetime.fromtimestamp(mktime(FEED_DATE))
    FEED_DATE_STRING = str(FEED_DATE_STRING)
    FEED_DATE_STRING = Datetime.ParseDate(FEED_DATE_STRING).strftime('%a %b %d, %Y')

但是在解析以下RSS格式时:

<item>
<title>Title</title>
<description>
Description
</description>
<lastBuildDate>Wed, 5 Oct 2011 03:11:00:00 +0700</lastBuildDate>
<pubDate>Wed, 5 Oct 2011 03:11:00:00 +0700</pubDate>
</item>

我在日志文件中得到错误:

FEED_DATE_STRING = datetime.fromtimestamp(mktime(FEED_DATE))TypeError:参数必须是9项序列,而不是None

假设您正在使用feedparser包来解析rss:日志文件中出现错误的原因是您使用了feedparser无法理解的日期格式。这意味着entry.updated_parsed将被设置为None。问题似乎出在时间字段的第四个元素上。如果日期更改为:

Wed, 5 Oct 2011 03:11:00 +0700

最新更新