提取字符串自 <script> - 美丽汤蟒蛇



我正在尝试创建一个python脚本来从网络邮件中提取一些信息。我想跟踪重定向。

我的代码 :

br1 = mechanize.Browser()
br1.set_handle_robots(False)
br1.set_cookiejar(cj)
br1.open("LOGIN URL")
br1.select_form(nr=0)
br1.form['username'] = mail_site
br1.form['password'] = pw_site
res1 = br1.submit()
html = res1.read()
print html

结果不是我所期望的。它仅包含一个重定向脚本。我已经看到我必须从此脚本中提取信息才能遵循此重定向。所以,就我而言,我必须将 jsessionid 提取到脚本中。

脚本是:

<script>
    function redir(){      
window.self.location.replace('/webmail/en_EN/continue.html;jsessionid=1D5QS4DA6C148DC4C14QS4CS5.1FDS5F4DSV1A64DA5DA?MESSAGE=NO_COOKIE&DT=1&URL_VALID=welcome.html');
return true;
}
</script>

如果我没错的话,我必须构建一个正则表达式。我尝试了很多东西,但没有结果。

有人有想法吗?

import re
get_jsession = re.search(r'jsessionid=([A-Za-z0-9.]+)',script_)
print(get_jsession.group(1))
>>> '1D5QS4DA6C148DC4C14QS4CS5.1FDS5F4DSV1A64DA5DA'

最新更新