避免使用硒进行reCAPTCHA

我试图使用Selenium(chromedriver(进行网络抓取，但总是得到reCaptchas(大约连续5-8个(，这是我必须解决的问题。当我用谷歌浏览器手动访问同一个网站时，我甚至没有得到一个Captcha。我不使用无头选项。。。有什么解决方案可以避免这些陷阱吗？或者一个请求最多可获得1-2个Captcha？我的意思是，解决Captchas对我来说不是问题，但连续5-8次需要很多时间。

有像2captcha这样的captcha解算器，每个captcha大约需要15-40秒。Captcha是用来检测各种形状和形式的机器人的，而且。。。这就是它所做的。简单的答案是：不，没有"旁路">
有一些解决方法可以避免整个系统，例如使用alt-login，例如可能使用不同API的应用程序。这可以通过类似于硒的appium或使用HTTPRequest库来实现。

我遇到了同样的问题。在网上，有很多技巧曾经像评论中的建议一样使用特定的标题，特别是明确设置用户代理或放慢页面上的操作(如点击(以模拟真实的用户操作。我发现它们目前都不适用于最新的reCaptcha版本，于是又回到了使用非无头模式，并在我的脚本接管之前手动解决captcha，并在通过captcha后发挥其魔力。

相关内容

最新更新

热门标签：