我如何用美丽的汤提取src


#page source for bs4
html = wd.page_source
soup = BeautifulSoup(html, "html.parser")  

thumbnail = (soup.find('div', attrs={ "class" : "preview"}))

输出

[<div class="preview">
<img alt="eye.jpg" src="https://thumb-service.domain.net/?sign=d85565637ccacf35673008b12871db54&amp;cdb=CPM&amp;fid=86274&amp;size=120&amp;format=jpg&amp;mtd=maxs&amp;mtdp=&amp;fp=&amp;ts=1461315108317" title="eye.jpg">
</img></div>]

我只想要带有 & as &的 src,我已经搜索并尝试了各种建议,但我无法得到这个

您可以使用

CSS 选择器选择图像标签本身:

thumbnails = soup.select('div.preview img[src]')
for thumbnail in thumbnails:
    url = thumbnail['src']

上面的 CSS 选择器在带有类 preview<div>内查找具有 src 属性的<img>标签。

你只需要第一个匹配项,然后使用select_one()

url = soup.select_one('div.preview img[src]')['src']

最新更新