小贝子编程

如何使用Bs4从DOM层次结构中的不同位置提取类似的信息

本文关键字：位置提取信息 Bs4 DOM 层次结构何使用 python beautifulsoup
更新时间 : 2023-09-21
英文 : How do I use Bs4 to pull similar information but from different places in DOM hierarchy?

我正试图从以下两个页面中抓取信息：

https://www.nysenate.gov/legislation/bills/2019/s240

https://www.nysenate.gov/legislation/bills/2019/s8450

我想做的是建立一个刮刀，可以下拉文本"；参见本法案的汇编版本"；。在上面列出的两个链接中，类是相同的，但对于一个页面来说，这是该类的唯一迭代，但对于另一个页面，这是第三个。

我正在尝试制作这样的作品：

assembly_version = soup.select_one(".bill-amendment-detail content active > dd")
print(assembly_version)

但我一直得到None

有什么想法吗？

url = "https://www.nysenate.gov/legislation/bills/2019/s11"
raw_html = requests.get(url).content
soup = BeautifulSoup(raw_html, "html.parser")
assembly_version = soup.find(class_="c-block c-bill-section c-bill--details").find("a").text.strip()
print(assembly_version)

如何使用Bs4从DOM层次结构中的不同位置提取类似的信息

相关内容

最新更新

热门标签：