#page source for bs4
html = wd.page_source
soup = BeautifulSoup(html, "html.parser")
thumbnail = (soup.find('div', attrs={ "class" : "preview"}))
输出
[<div class="preview">
<img alt="eye.jpg" src="https://thumb-service.domain.net/?sign=d85565637ccacf35673008b12871db54&cdb=CPM&fid=86274&size=120&format=jpg&mtd=maxs&mtdp=&fp=&ts=1461315108317" title="eye.jpg">
</img></div>]
我只想要带有 & as &的 src,我已经搜索并尝试了各种建议,但我无法得到这个
您可以使用
CSS 选择器选择图像标签本身:
thumbnails = soup.select('div.preview img[src]')
for thumbnail in thumbnails:
url = thumbnail['src']
上面的 CSS 选择器在带有类 preview
的<div>
内查找具有 src
属性的<img>
标签。
你只需要第一个匹配项,然后使用select_one()
:
url = soup.select_one('div.preview img[src]')['src']