我使用提要解析器来获取rss对象。当我运行
live_leak.links
我[{'type': 'text/html', 'rel': 'alternate', 'href':
'http://www.liveleak.com/view?i=abf_1476121939'},
{'type': 'application/x-shockwave-flash', 'rel': 'enclosure', 'href':
'http://www.liveleak.com/e/abf_1476121939'}]
但是当我尝试这个
live_leak.links[1]
我得到列表索引超出范围,请注意,这之前是工作的,然后突然就不起作用了。我的代码中有这个,我花了几个小时才找到,因为我没有意识到是这个不起作用。如果没有人知道,我会做一个字符串替换作为一个hack,但我宁愿做已经工作。
live_leak[0]
返回[{'type': 'text/html', 'rel': 'alternate', 'href':
'http://www.liveleak.com/view?i=abf_1476121939'}]
很奇怪,因为另一个不起作用
<标题>编辑def pan_task():
url = 'http://www.liveleak.com/rss?featured=1'
name = 'live leak'
live_leaks = [i for i in feedparser.parse(url).entries]
the_count = len(live_leaks)
ky = feedparser.parse(url).keys()
oky = [i.keys() for i in feedparser.parse(url).entries][:12] # shows what I can pull
try:
live_entries = [{
'html': live_leak.links,
'href': live_leak.links[0]['href'],
'src': live_leak.media_thumbnail[0]['url'],
'text': live_leak.title,
'comments': live_leak.description,
'url': live_leak.links[0]['href'],
'embed': live_leak.links[1]['href'],
'text': live_leak.title,
'comments': live_leak.description,
'name': name,
'url': live_leak.link, # this is the link to the source
'author': None,
'video': False
} for live_leak in live_leaks]
except IndexError:
print('error check logs')
live_entries = []
# for count, elem in enumerate(live_entries):
# the_html = requests.get(live_entries[count]['url']) # a specific text
return print(live_entries[0])
标题>您可以索引live_leak,但是live_leak。links似乎是返回live_leak的元素的其他类型的构造。试试live_leak[1] ?
一个是在寻找live_leak下的链接,另一个只是在看live_leak本身。
例如:live_leak [1]
应该返回:[{'type': 'application/x-shockwave-flash', 'rel': 'enclosure', 'href':"http://www.liveleak.com/e/abf_1476121939"}]