如何访问selenium python中脚本标记内的get数据



我正试图从window.open函数的javascript部分内部获取数据。

<script type="text/javascript">
//<![CDATA[
window.open('abc.pdf','_blank')//]]>
</script>

我想要abc.pdf链接有办法得到这个吗

一种方法是使用regex 解决问题

In [33]: html
Out[33]: '<script type="text/javascript">n//<![CDATA[nwindow.open('abc.pdf','_blank')//]]>n</script>'
In [34]: import re
In [35]: group = re.search("window.open((.*))", html)
In [36]: group[1].replace("'","").split(",")[0]
Out[36]: 'abc.pdf'

我相信您可以通过将页面源代码保存在变量中,然后使用正则表达式进行搜索来实现这一点。[如@bigbundy所述]。请在下面找到代码。

mysource = driver.page_source
re.search("window.open((.*))", mysource )

注意-我还没有测试过这段代码,它应该被视为一种整体解决问题的方法。

最新更新