我正在尝试创建一个python脚本来从网络邮件中提取一些信息。我想跟踪重定向。
我的代码 :
br1 = mechanize.Browser()
br1.set_handle_robots(False)
br1.set_cookiejar(cj)
br1.open("LOGIN URL")
br1.select_form(nr=0)
br1.form['username'] = mail_site
br1.form['password'] = pw_site
res1 = br1.submit()
html = res1.read()
print html
结果不是我所期望的。它仅包含一个重定向脚本。我已经看到我必须从此脚本中提取信息才能遵循此重定向。所以,就我而言,我必须将 jsessionid 提取到脚本中。
脚本是:
<script>
function redir(){
window.self.location.replace('/webmail/en_EN/continue.html;jsessionid=1D5QS4DA6C148DC4C14QS4CS5.1FDS5F4DSV1A64DA5DA?MESSAGE=NO_COOKIE&DT=1&URL_VALID=welcome.html');
return true;
}
</script>
如果我没错的话,我必须构建一个正则表达式。我尝试了很多东西,但没有结果。
有人有想法吗?
import re
get_jsession = re.search(r'jsessionid=([A-Za-z0-9.]+)',script_)
print(get_jsession.group(1))
>>> '1D5QS4DA6C148DC4C14QS4CS5.1FDS5F4DSV1A64DA5DA'