使用"tag.find_all"作为具有随机数的访问器(BeautifulSoup)


<a href="some_url" game_id="Some integers"</a>

"一些整数"是在每个href链接中更改的数字。

我想从中提取 href "一些网址"。

我现在的代码:

for link in table.find_all("a",{"game_id":?}):
href=link.get(href)

我应该在"game_id"中输入什么:问号,以便代码可以检测到 href 链接?

对于第一位,您需要regex来处理此问题。

import re
for link in table.find_all('a', {'game_id' : re.compile('d+')}):
href = link.get("href") # or href = link["href"]

此外,您可以使用双引号访问href字段。

最新更新