我想有这个网站的链接:https://www.bilansgratuits.fr/secteurs/finance-assurance,k.html
但不是所有的链接,只有:links
不幸的是,我的脚本在这里给我所有的链接。
import requests
from requests import get
from bs4 import BeautifulSoup
import pandas as pd
url = 'https://www.bilansgratuits.fr/secteurs/finance-assurance,k.html'
links = []
results = requests.get(url)
soup = BeautifulSoup(results.text, "html.parser")
links = [a['href'] for a in soup.find_all('a', href=True)]
print(links)
你知道怎么做吗?
你想要的所有链接都包含在一个类名为listeEntreprises
的div中,所以你可以做
links = [a['href'] for a in soup.find("div", {"class": "listeEntreprises"}).find_all('a', href=True)]