如何使用Selenium打印网页的所有html/css标签:
from selenium import webdriver
browser = webdriver.Firefox()
browser.get('http://seleniumhq.org/')
当我这样做时:
print(browser),
它打印这个:
"<selenium.webdriver.firefox.webdriver.WebDriver (session="ce01359c-03e4-499d-a3fb-230bda9ac24c")>"
这是一个对象或变量还是列表/集合/元组/字典还是什么?有人可以解释一下吗?
你得到的结果是一个对象。在代码开始时,您选择调用此对象浏览器(也称为将其分配给变量)。当你运行函数browser.get()时,它不会改变变量浏览器的内容,因此结果与你所在的网页无关。
您应该查看文档,特别是此页面,因为它提供了很好的介绍。如果您完成该解释,您应该对 API 的工作原理有一个很好的(基本)了解。其他章节可以填补有关在页面中查找元素的细节的空白。
另一方面,如果你所做的只是抓取HTML,我建议你看看美丽的汤。
你没看错。根据"新建会话"的文档,"新建会话"命令使用终结点节点创建新的 WebDriver 会话。
HTTP Method URI Template
POST /session
根据远程端步骤,整个过程完全取决于实现,但通常需要跟踪上游远程端的sessionId
、URL
和URL prefix
。此外
会话 ID 是生成 UUID 的结果。
会话是会话 ID 为会话 ID 的新会话。
因此,作为class selenium.webdriver.firefox.webdriver.WebDriver()
对象的浏览器打印以下内容:
"<selenium.webdriver.firefox.webdriver.WebDriver (session="ce01359c-03e4-499d-a3fb-230bda9ac24c")>"
您可以在 Webdrivers 返回的值中找到相关的讨论