问题:-我想只使用一行代码获取网页中的所有h3标签。
我知道如何使用beautifulsoup获取标签及其内部HTML,但一次只能获取一个。这是基本代码:-
from bs4 import BeautifulSoup
import requests
source = requests.get("https://en.wikipedia.org/wiki/Code").text
soup = BeautifulSoup(source, 'lxml')
content = soup.find("span")
spans = content
print(spans)
输出:
<span>...</span>
如上所述,当我需要所有跨度都显示为输出时,它只返回一个跨度,有点像:<span>...</span>,<span>...</span>
请指导我做这个
试试这个
import bs4
soup1 = bs4.BeautifulSoup(htm1, 'html.parser')
for match in soup1.findAll('span'):
match.unwrap()
print soup1