如何理解 Selenium 中的 webdriver 和 get()?



如何使用Selenium打印网页的所有html/css标签:

from selenium import webdriver
browser = webdriver.Firefox()
browser.get('http://seleniumhq.org/')

当我这样做时:

print(browser),

它打印这个:

"<selenium.webdriver.firefox.webdriver.WebDriver (session="ce01359c-03e4-499d-a3fb-230bda9ac24c")>"

这是一个对象或变量还是列表/集合/元组/字典还是什么?有人可以解释一下吗?

你得到的结果是一个对象。在代码开始时,您选择调用此对象浏览器(也称为将其分配给变量)。当你运行函数browser.get()时,它不会改变变量浏览器的内容,因此结果与你所在的网页无关。

您应该查看文档,特别是此页面,因为它提供了很好的介绍。如果您完成该解释,您应该对 API 的工作原理有一个很好的(基本)了解。其他章节可以填补有关在页面中查找元素的细节的空白。

另一方面,如果你所做的只是抓取HTML,我建议你看看美丽的汤。

你没看错。根据"新建会话"的文档,"新建会话"命令使用终结点节点创建新的 WebDriver 会话。

HTTP Method     URI Template
POST            /session

根据远程端步骤,整个过程完全取决于实现,但通常需要跟踪上游远程端的sessionIdURLURL prefix。此外

  • 会话 ID 是生成 UUID 的结果。

  • 会话是会话 ID 为会话 ID 的新会话。

因此,作为class selenium.webdriver.firefox.webdriver.WebDriver()对象的浏览器打印以下内容:

"<selenium.webdriver.firefox.webdriver.WebDriver (session="ce01359c-03e4-499d-a3fb-230bda9ac24c")>"

您可以在 Webdrivers 返回的值中找到相关的讨论

相关内容

  • 没有找到相关文章

最新更新