我试图使用Selenium(chromedriver(进行网络抓取,但总是得到reCaptchas(大约连续5-8个(,这是我必须解决的问题。当我用谷歌浏览器手动访问同一个网站时,我甚至没有得到一个Captcha。我不使用无头选项。。。有什么解决方案可以避免这些陷阱吗?或者一个请求最多可获得1-2个Captcha?我的意思是,解决Captchas对我来说不是问题,但连续5-8次需要很多时间。
有像2captcha这样的captcha解算器,每个captcha大约需要15-40秒。Captcha是用来检测各种形状和形式的机器人的,而且。。。这就是它所做的。简单的答案是:不,没有"旁路">
有一些解决方法可以避免整个系统,例如使用alt-login,例如可能使用不同API的应用程序。这可以通过类似于硒的appium或使用HTTPRequest库来实现。
我遇到了同样的问题。在网上,有很多技巧曾经像评论中的建议一样使用特定的标题,特别是明确设置用户代理或放慢页面上的操作(如点击(以模拟真实的用户操作。我发现它们目前都不适用于最新的reCaptcha版本,于是又回到了使用非无头模式,并在我的脚本接管之前手动解决captcha,并在通过captcha后发挥其魔力。