html代码
在该图像中,div id="root">中有html代码
这是代码:
import requests
from bs4 import BeautifulSoup
URL = 'https://www.daraz.com.bd/catalog/?spm=a2a0e.home.search.3.73524591owXnnM&q=mobile'
page = requests.get(URL)
soup = BeautifulSoup(page.content, 'html.parser')
result = soup.find("div", id="root")
print(result)
输出为:
<div id="root"></div>
为什么div中的html代码没有被解析?
<div id="root"></div>
内部的内容可能是动态加载的。如果您访问禁用JavaScript的页面,您可以自行检查。使用您的方法,BeatifulSoup不会解析动态添加的内容(通过JavaScript(。
更多详情点击这里=>BeautifulSoup不抓取动态内容
我建议在您的情况下使用无头浏览器,以便能够获取使用JavaScript生成的动态内容。(无头浏览器能够执行JavaScript,因此可以访问动态内容进行解析(