findall只返回最后一个属性



我搜索过类似的问题,但没有找到我需要的。

我在网上搜索span中的redgreen这两个属性

from urllib.request import urlopen
from bs4 import BeautifulSoup
html=urlopen('http://www.pythonscraping.com/pages/warandpeace.html')
soup=BeautifulSoup(html,'html.parser')
nameList=soup.findAll("span",{"class":"red","class":"green"})
print(nameList)

然而,我只得到了绿色属性,我尝试使用

nameList,nameList2=soup.findAll("span",{"class":"red","class":"green"})

但是我得到了错误ValueError: too many values to unpack (expected 2)有没有一种方法可以打印两者并将每个属性存储在名称列表中(而不使用多个findAll(

您可以尝试使用CSS选择器将span与两个类名进行匹配,如下所示:

nameList = soup.select("span.red, span.green")

如果您仍然想使用findAll,请尝试

nameList = soup.findAll("span",{"class":["red", "green"]})

由于红色和绿色是唯一的类属性,您可以使用类属性检查span

from urllib.request import urlopen
from bs4 import BeautifulSoup
html=urlopen('http://www.pythonscraping.com/pages/warandpeace.html')
soup=BeautifulSoup(html,'html.parser')
nameList=soup.select("span[class]")
print(nameList)

要有单独的列表,您可以使用2个按类名选择:

reds = soup.select('span.red')
greens = soup.select('span.green')
print(reds,greens)

相关内容

最新更新