在 Python 中使用 Beautiful Soup 抓取多个同名的 div 类



我已经成功地抓取了网页的图像和标题(代码中的URL(。我想为此页面上的所有电影执行此操作。"movie_list"包含所有这些,但只抓取了第一部电影信息。

我尝试将.find更改为.find_all但这给了我一个错误。

url = 'https://5movies.to/movie/'
content = session.get(url, verify=False).content
soup = BeautifulSoup(content, "html.parser")
movie_list = soup.find_all('div', {'class': 'movie-list'})
all_item = []
for allContainers in movie_list:
filmName = allContainers.find('img').get('alt')
filmFoto = allContainers.find('img').get('src')
filmLink = allContainers.find('a').get('href')
print(filmName)

for循环内移动 print 语句使其打印出整个列表。 事实上,我用all_item.append((filmName, filmFoto, filmLink))替换了print,将其发送到我的前端。

感谢@furas提供信息!

url = 'https://5movies.to/movie/'
content = session.get(url, verify=False).content
soup = BeautifulSoup(content, "html.parser")
movie_list = soup.find_all('div', {'class': 'movie-list'})
all_item = []
for allContainers in movie_list:
filmName = allContainers.find('img').get('alt')
filmFoto = allContainers.find('img').get('src')
filmLink = allContainers.find('a').get('href')
print(filmName)

最新更新