如何在 python 中获取 html #document 标签?


<html>
<head>...</head>
<body>
<iframe id="hiddenFrame" name="hiddenFrame">
#document
<html>
<head>...</head>
<body>...</body>
</html>
</iframe>
</html>

这是我想要抓取的网站结构。 我试图在 #document 标签中获取html(尝试使用urllib.request和请求( 但我无法在 #document 内获取 html..

请求结果:

<html>
<head>...</head>
<body>
<iframe></iframe>
</body>
</html>

iframe 标记中没有任何内容。 如何在 #document 标签中获取 html?

我通常使用硒来处理这些情况。 基本上,您必须进入iframe才能获取内容。

看到这个问题。

iframe 没有 src 属性吗?

为什么不这样做:

首先,使用请求获取页面,然后使用 beautifulsoup4 获取 iframe 中的 src 属性。

获取 iframe src 属性后,请执行请求。

瞧,你会在iframe内得到页面

最新更新