这是我想要网络抓取的部分的屏幕截图,我拍了一张屏幕截图,因为我只想给出一个完整的图片
我正试图在网络上抓取BBC网站的某个部分,这是最新的更新部分。它看起来有点像这里输入图像描述
我不知道在Beautifulsoup找什么。利用我已经掌握的知识,我尝试了bsObj.findAll(id="latest-updates")
,但它当然不起作用。如果有人需要最新更新的链接,可以在这里https://www.bbc.co.uk/news/uk向下滚动可以获得最新的更新
我正试图找到一种方法,通过使用id来获取最新更新部分中的所有链接?如果正确的方法是使用id=最新更新,有人能告诉我我做错了什么吗?或者,如果我完全错了,告诉我我应该在这个特定的最新更新下找到链接
如果这是一个太多的特定问题,很抱歉,
感谢您对问题的帮助
如果你在寻找最新更新的标题链接,我认为你应该搜索"a"和标题的类。如果我没有错的话,这应该是正确的发现
findAll("a", {"class": "qa-heading-link lx-stream-post__header-link"})