如何检查一个特定的文本是否存在于一个网站和保存链接- python?



我有这个网站:https://geo1.ville.levis.qc.ca/grilleusage/default.aspx?zoneid = 1我需要一个代码来检查不同的zoneid,[1 ~ 3000]。并检查单词"H10"存在于那个链接中(比如这个https://geo1.ville.levis.qc.ca/grilleusage/default.aspx?zoneid=0160)如果"h10"这个词;我希望保存包含该单词的所有链接。谢谢你。

您可以使用此示例遍历不同的区域并检查是否存在与H10的链接:

import requests
from bs4 import BeautifulSoup
url = "https://geo1.ville.levis.qc.ca/grilleusage/default.aspx?zoneid={}"
for zoneid in range(159, 165):  # <--- adjust pages here, for eg. (1, 3001)
u = url.format(zoneid)
print("Checking {}".format(u))
soup = BeautifulSoup(requests.get(u).content, "html.parser")
h10_links = soup.select('a:-soup-contains("H10")')
for link in h10_links:
print(link["href"])

打印:

Checking https://geo1.ville.levis.qc.ca/grilleusage/default.aspx?zoneid=159
Checking https://geo1.ville.levis.qc.ca/grilleusage/default.aspx?zoneid=160
https://www.ville.levis.qc.ca/fileadmin/documents/pdf/permis/classes_usages_zonage_vdl.pdf
Checking https://geo1.ville.levis.qc.ca/grilleusage/default.aspx?zoneid=161
Checking https://geo1.ville.levis.qc.ca/grilleusage/default.aspx?zoneid=162
Checking https://geo1.ville.levis.qc.ca/grilleusage/default.aspx?zoneid=163
Checking https://geo1.ville.levis.qc.ca/grilleusage/default.aspx?zoneid=164

相关内容

最新更新