如何计算网站上的广告数量



我四处寻找,但什么也找不到。是否有可能抓取和识别广告的使用(并可能在任何给定的网站上计算它们?

例如,这个页面有13个广告。

我目前正在使用BeautifulSoup获取页面

headers = {'Content-Type':'application/json'}
url = requests.get("https://www.worthofweb.com/website-value/wikipedia.com/")
response = requests.request(method="GET", url=url, headers=headers, timeout=5)
response.raise_for_status()
soup = BeautifulSoup(response.text, "html.parser")

分析页面时出现问题。

您可以考虑分析DOM中的每个元素,并检查标准广告大小。这是一个列表:

https://www.creatopy.com/blog/banner-standard-sizes/

简单地说,从元素的样式中获取宽度/高度,并查看它是否与标准广告单元大小相匹配。如果是这样的话,我们可以说这是一则广告(不过也可能是误报(。

相关内容

最新更新