我创建了一个代码,可以从网站上抓取表格,但由于某种原因它只抓取了部分信息。 当我使用 .字符串它不会为所需的其他两个数据打印任何内容。当我删除 .string 时,它会固定 li 类和我需要的数据以及跨度。它还打印出图像源,但我只需要图像的名称和夹具。
我的代码是;
import urllib2
from BeautifulSoup import BeautifulSoup
soup = BeautifulSoup(urllib2.urlopen('http://www.livefootballontv.com/').read())
for row in soup('div', {'id': 'tv-guide'})[0]('ul'):
tds = row('li')
#ths = row('th')
print tds[0].string, tds[1], tds[2].string, tds[3].string, '/n'
这打印出来;
星期六 08 二月 2014 中央海岸水手 vs 墨尔本胜利现代A联赛 06:30am 无/n
不得不在跨度上使用 .text,对于另一个我使用 .img['alt'] 这工作正常