在类开始相同但结束不同的情况下报废数据



我正在学习Web Scraping,我正在努力获取所有的工作列表。所有不同的作业列表都在一个标记中,类都以"tapItem fs unmask result"开头,但不同的是,当类包含"tapItem fsunmask result"而不仅仅是确切的类名时,我该如何查找。我的代码如下,尽管我是从教程中复制的,所以我确信他们是从不同的网站中抓取的是正确的

from bs4 import BeautifulSoup
import requests
html_text = 
requests.get('https://uk.indeed.com/jobs? q=python&l=Bonnyrigg&sort=date&vjk=79b56b0a7deea1aa').text
soup = BeautifulSoup(html_text, 'lxml')
jobs = soup.find_all('a', #where class = tapItem fs-unmask result  )
print(jobs)

这个怎么样:

from bs4 import BeautifulSoup
import requests
html_text = requests.get('https://uk.indeed.com/jobs?q=python&l=Bonnyrigg&sort=date&vjk=79b56b0a7deea1aa').text
soup = BeautifulSoup(html_text, 'lxml')
jobs = soup.find_all('a',class_=lambda value: value and value.startswith("tapItem fs-unmask result"))
print(jobs)

最新更新