我正在使用selenium和python,以便在网站上抓取数据。
问题是我需要手动登录,因为登录后有一个验证码。
我的问题如下:是否有一种方法可以在已经加载的页面上启动程序?(例如,在这里我将登录到网站,手动解决CAPTCHA,然后启动将抓取数据的程序)
注意:我一直在寻找SO的答案,但没有找到它,可能错过了它,因为它似乎是一个明显的问题。
不要在无头模式下打开。打开头部模式
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
import time
options = Options()
options.headless = False # Set false here
driver = webdriver.Chrome(options=options, executable_path=r'C:pathtochromedriver.exe')
driver.get("http://google.com/")
print ("Headless Chrome Initialized")
time.sleep(30) # wait 30 seconds, this should give enough time to manually do the capture
# do other code here
driver.quit()