我正在尝试浏览网页,从中抓取数据。我有几个更多的链接随着提到的链接工作在一个for循环。然而,与其他链接不同的是,当get()函数试图访问这个链接时,它会给我下面的错误:
代码声明:
driver = webdriver.Chrome(executable_path="..Driverschromedriver.exe")
def page_content_extractor(given_line):
print('in page content extractor function. Given link is : ',given_line)
try:
driver.get(given_line)
except Exception as e:
print('Exception occurred !! Find these links under rogue links')
print(e)
time.sleep(2)
异常声明:
selenium.common.exceptions.WebDriverException: Message: unknown error: unexpected command response
(Session info: chrome=103.0.5060.66)
Stacktrace:
Backtrace:
Ordinal0 [0x006FD953+2414931]
Ordinal0 [0x0068F5E1+1963489]
Ordinal0 [0x0057C6B8+837304]
Ordinal0 [0x0056EB34+781108]
Ordinal0 [0x0056E06A+778346]
Ordinal0 [0x0056D646+775750]
Ordinal0 [0x0056CEBC+773820]
Ordinal0 [0x0056CD59+773465]
Ordinal0 [0x0057DA70+842352]
Ordinal0 [0x005CAB6F+1157999]
Ordinal0 [0x005C4463+1131619]
Ordinal0 [0x0059E860+976992]
Ordinal0 [0x0059F756+980822]
GetHandleVerifier [0x0096CC62+2510274]
GetHandleVerifier [0x0095F760+2455744]
GetHandleVerifier [0x0078EABA+551962]
GetHandleVerifier [0x0078D916+547446]
Ordinal0 [0x00695F3B+1990459]
Ordinal0 [0x0069A898+2009240]
Ordinal0 [0x0069A985+2009477]
Ordinal0 [0x006A3AD1+2046673]
BaseThreadInitThunk [0x7660FA29+25]
RtlGetAppContainerNamedObjectPath [0x77B07A9E+286]
RtlGetAppContainerNamedObjectPath [0x77B07A6E+238]
Process finished with exit code 1
这里还要提到的一点是,这个异常不会为其他url抛出。不知道到底是哪里出了问题,也不知道该如何处理。试过使用try-except,但即使这样似乎也不起作用。
您必须下载最新版本的chrome驱动文件并使用它的项目。更新桌面到最新的chrome版本(右侧三个点选项>>帮助>>关于Chrome和使用chromedriver exe从下面路径支持Chrome版本。
Chrome驱动:https://chromedriver.chromium.org/downloads