我搜索过类似的问题,但没有找到我需要的。
我在网上搜索span
中的red
和green
这两个属性
from urllib.request import urlopen
from bs4 import BeautifulSoup
html=urlopen('http://www.pythonscraping.com/pages/warandpeace.html')
soup=BeautifulSoup(html,'html.parser')
nameList=soup.findAll("span",{"class":"red","class":"green"})
print(nameList)
然而,我只得到了绿色属性,我尝试使用
nameList,nameList2=soup.findAll("span",{"class":"red","class":"green"})
但是我得到了错误ValueError: too many values to unpack (expected 2)
有没有一种方法可以打印两者并将每个属性存储在名称列表中(而不使用多个findAll
(
您可以尝试使用CSS选择器将span
与两个类名进行匹配,如下所示:
nameList = soup.select("span.red, span.green")
如果您仍然想使用findAll
,请尝试
nameList = soup.findAll("span",{"class":["red", "green"]})
由于红色和绿色是唯一的类属性,您可以使用类属性检查span
from urllib.request import urlopen
from bs4 import BeautifulSoup
html=urlopen('http://www.pythonscraping.com/pages/warandpeace.html')
soup=BeautifulSoup(html,'html.parser')
nameList=soup.select("span[class]")
print(nameList)
要有单独的列表,您可以使用2个按类名选择:
reds = soup.select('span.red')
greens = soup.select('span.green')
print(reds,greens)