如何使用Bs4从DOM层次结构中的不同位置提取类似的信息



我正试图从以下两个页面中抓取信息:

https://www.nysenate.gov/legislation/bills/2019/s240

https://www.nysenate.gov/legislation/bills/2019/s8450

我想做的是建立一个刮刀,可以下拉文本";参见本法案的汇编版本";。在上面列出的两个链接中,类是相同的,但对于一个页面来说,这是该类的唯一迭代,但对于另一个页面,这是第三个。

我正在尝试制作这样的作品:

assembly_version = soup.select_one(".bill-amendment-detail content active > dd")
print(assembly_version)

但我一直得到None

有什么想法吗?

url = "https://www.nysenate.gov/legislation/bills/2019/s11"
raw_html = requests.get(url).content
soup = BeautifulSoup(raw_html, "html.parser")
assembly_version = soup.find(class_="c-block c-bill-section c-bill--details").find("a").text.strip()
print(assembly_version)

最新更新