我正试图在Selenium的帮助下获得特定网站的源代码:
Python代码:
driver.page_source
但它会在编码后返回它。
原始文件:
<html>
<head>
<title>AAAAAAAA</title>
</head>
<body>
</body>
当在Chrome中按下"查看页面源代码"时,我看到了正确的原始源代码,没有编码。
如何做到这一点?
您可以尝试使用Javascript而不是Python内置代码来获取页面源代码。
javascriptPageSource = driver.execute_script("return document.body.outerHTML;")