我正在使用美丽的汤试图从守望先锋联赛时间表网站使用美丽的汤获取数据,然而,尽管所有的文档都说bs4能够找到嵌套的div,如果我有他们的类,它只返回一个空列表。
这里是url: https://overwatchleague.com/en-us/schedule?stage=regular_season&week=1
这是我想要得到的:
bs = BeautifulSoup(req.text, "html.parser")
matches = bs.find_all("div", class_="schedule-boardstyles__ContainerCards-j4x5cc-8 jcvNlt")
最终能够遍历其中的div并从中抓取匹配数据。然而,它不工作,只返回[]
,有什么我做错了吗?
加载页面时,通常会运行一些脚本来填充信息。
Beautifulsoup只是一个解析器,不能渲染页面。
在使用beautifulsoup查找元素 之前,您将需要像selenium这样的东西来渲染页面。它不工作,因为request
在页面完全加载之前获得html。我觉得没办法再等了。你可以试试用selenium