当涉及跨度时,如何抓取 img 源和数据的名称 Python.



我创建了一个代码,可以从网站上抓取表格,但由于某种原因它只抓取了部分信息。 当我使用 .字符串它不会为所需的其他两个数据打印任何内容。当我删除 .string 时,它会固定 li 类和我需要的数据以及跨度。它还打印出图像源,但我只需要图像的名称和夹具。

我的代码是;

import urllib2
from BeautifulSoup import BeautifulSoup
soup = BeautifulSoup(urllib2.urlopen('http://www.livefootballontv.com/').read())
for row in soup('div', {'id': 'tv-guide'})[0]('ul'):
    tds = row('li')
    #ths = row('th')
    print tds[0].string, tds[1], tds[2].string, tds[3].string, '/n'

这打印出来;

星期六 08 二月 2014 中央海岸水手 vs 墨尔本胜利现代A联赛 06:30am 无/n

不得不在跨度上使用 .text,对于另一个我使用 .img['alt'] 这工作正常

最新更新