如何理解 Selenium 中的 webdriver 和 get()?

如何使用Selenium打印网页的所有html/css标签：

from selenium import webdriver
browser = webdriver.Firefox()
browser.get('http://seleniumhq.org/')

当我这样做时：

print(browser),

它打印这个：

"<selenium.webdriver.firefox.webdriver.WebDriver (session="ce01359c-03e4-499d-a3fb-230bda9ac24c")>"

这是一个对象或变量还是列表/集合/元组/字典还是什么？有人可以解释一下吗？

你得到的结果是一个对象。在代码开始时，您选择调用此对象浏览器(也称为将其分配给变量)。当你运行函数browser.get()时，它不会改变变量浏览器的内容，因此结果与你所在的网页无关。

您应该查看文档，特别是此页面，因为它提供了很好的介绍。如果您完成该解释，您应该对 API 的工作原理有一个很好的(基本)了解。其他章节可以填补有关在页面中查找元素的细节的空白。

另一方面，如果你所做的只是抓取HTML，我建议你看看美丽的汤。

你没看错。根据"新建会话"的文档，"新建会话"命令使用终结点节点创建新的 WebDriver 会话。

HTTP Method     URI Template
POST            /session

根据远程端步骤，整个过程完全取决于实现，但通常需要跟踪上游远程端的sessionId、URL和URL prefix。此外

因此，作为class selenium.webdriver.firefox.webdriver.WebDriver()对象的浏览器打印以下内容：

"<selenium.webdriver.firefox.webdriver.WebDriver (session="ce01359c-03e4-499d-a3fb-230bda9ac24c")>"

您可以在 Webdrivers 返回的值中找到相关的讨论

相关内容