我想加载一个网站并收集所有的链接,这通常是相当简单的,但是我今天有这个奇怪的反应:
links = WebDriverWait(web, 20).until(EC.presence_of_all_elements_located((By.XPATH,'//a[@href]')))
print("This is what is showing for links", links) # Debug
谁能解释一下这里可能发生了什么?这是链接显示的内容[& lt; selenium.webdriver.remote.webelement.WebElement(会话="33 f088aa2028ccf3e49527ba2bbf4648"元素="ba0c173a-a4ae-4b91-a166-42e7aa0f9f04"比;& lt; selenium.webdriver.remote.webelement.WebElement(会话="33 f088aa2028ccf3e49527ba2bbf4648"元素="833 ca6d1 cc72 - 4830 - 9529 - ed068680d4b7")祝辞]
如果您想从链接中收集所有url,请尝试:
url_list = [link.get_attribute('href') for link in links]