我正在尝试使用jupyter notebook中的python跟踪亚马逊上产品的价格。我已经导入了 bs4 并请求此任务。
当我检查产品页面中的 HTML 时,我可以看到<span id="productTitle" class="a-size-large">
但是,当我尝试使用soup.find(id = "productTitle")
搜索它时,结果显示为None
我尝试使用其他 id 和类soup.find
但结果仍然None
title = soup.find(id="productTitle")
这是我查找 id 的代码
如果我解决这个问题,我希望能够获得我将跟踪其价格的产品的名称
该信息存储在返回 html 中的不同位置。您是否检查了您的响应,以确保您没有被阻止或收到意外的响应?
我用那个id找到了它,使用和剥离
import requests
from bs4 import BeautifulSoup as bs
r = requests.get('https://www.amazon.com/dp/B00M4LWO8O/')
soup = bs(r.content, 'lxml')
print(soup.select_one('#productTitle').text.strip())
也
import requests
from bs4 import BeautifulSoup as bs
r = requests.get('https://www.amazon.com/dp/B00M4LWO8O/')
soup = bs(r.content, 'lxml')
print(soup.select_one('#imgTagWrapperId img[alt]')['alt'])