小贝子编程

当一个网站被一只报废的蜘蛛刮伤时，它可以获得哪些信息

本文关键字：信息网站一个一只 python scrapy web-crawler
更新时间 : 2023-09-19
英文 : Which information a site can get when scraped by a scrapy spider?

我有一个单文件蜘蛛，它只抓取一个站点。网站所有者可以看到哪些信息？

在这里，我没有使用自定义设置。(所以这是默认设置(。

示例：

1.蜘蛛名称

2.IP

3.OS

网站所有者可以看到这些信息。

蜘蛛名称。你可以将更改为任何你想要的
您可以使用VPN或代理更改IP地址
您正在使用的浏览器。要更改此设置，请转到设置并查找USER_AGENT删除评论，你就可以很容易地在谷歌上搜索其他用户代理
饼干。Scrapy默认启用cookie。转到设置并查找COOKIES_ENABLED删除注释，使其设置为False。这将使刮擦工作更加隐秘。
并发请求。在设置中也是如此。这是你同时提出的请求数量。最好降低数字，这样对网站更友好。

相关内容

最新更新