Python3存储链接,如果它包含列表中的项



我正在收集来自单个网页的所有链接,并试图仅存储包含列表中字符串的链接。我可以得到所有的链接使用这个:

links=[]
for link in soup.findAll('a')
links.append(link.get('href'))

代码工作,但返回一个超过700个链接的大列表。我想把它们简化为只包含列表中的项目。我正试图像这样使用any函数:

list_of_keywords = ['word1', 'word2', 'word3']
links=[]
for link in soup.findAll('a')
if any(word in link for word in list_of_keywords):
links.append(link.get('href'))

返回0。我知道列表中的单词都包含在链接中。我做错了什么?谢谢你的帮助!

我明白了。link作为bs4.element.Tag返回。我必须先执行link.get('href')。一旦完成,我就可以对照列表进行检查。

最新更新