我正试图在登录的页面上使用selenium进行一些授权。
该页面具有captcha,因此无法实现登录过程的自动化,有没有办法登录,保存cookie,然后将其导入另一个浏览器实例?
为了在抓取时绕过CAPTCHA,您必须手动解决CAPTCHA并导出您获得的cookie。现在,每次打开Selenium WebDriver时,请确保添加导出的cookie。为了安全起见,请保存所有cookie。
如果你想在你的抓取中增加一层稳定性,你应该导出几个cookie,并让你的脚本在每次登录页面时随机选择其中一个。
这些cookie的有效期很长,所以你不需要每天都收到新的cookie。
有关在Python和Selenium中保存和加载cookie的帮助,您可以使用以下代码:
您可以使用pickle将当前cookie保存为Python对象。例如:
import pickle
import selenium.webdriver
driver = selenium.webdriver.Firefox()
driver.get("http://www.google.com")
pickle.dump( driver.get_cookies() , open("cookies.pkl","wb"))
稍后将其添加回:
import pickle
import selenium.webdriver
driver = selenium.webdriver.Firefox()
driver.get("http://www.google.com")
cookies = pickle.load(open("cookies.pkl", "rb"))
for cookie in cookies:
driver.add_cookie(cookie)