Python Web Scraping with JavaScript Do Postback



我一直在尝试:

  1. 转到:mdoe.state.mi.us/moecs/publiccredentialsearch.aspx

  2. 输入证书编号(为了插图,您只需搜索"戴维森"作为姓氏)。

  3. 单击与"专业教学证书"相对应的链接。

  4. 复制并粘贴结果表。

我相信,我相信渲染以获取数据。

查看源代码时,请查看HREF部分如何标识这样的单个链接?(第6链接下):

href="javascript:__doPostBack('ctl00$ContentPlaceHolder1$gViewCredentialSearchList$ctl07$link1','')

由此:

<td class="MOECSNormal" style="border-color:Black;border-width:1px;border-style:Solid;">Professional Teaching Certificate Renewal</td><td class="MOECSNormal" style="border-color:Black;border-width:1px;border-style:Solid;">
                                            <a id="ContentPlaceHolder1_gViewCredentialSearchList_link1_5" ItemStyle-BorderColor="Black" ItemStyle-BorderStyle="Solid" ItemStyle-BorderWidth="1px" href="javascript:__doPostBack('ctl00$ContentPlaceHolder1$gViewCredentialSearchList$ctl07$link1','')">CC-XWT990004102</a>
                                        </td>

我正在寻找一种(通过python)将我需要的数据获取到表格中,并给定认证号和证书名称(即"专业教学证书"。

我尝试使用PYQT4遵循教程,但单独安装它是创伤的。

预先感谢!

您可以在浏览器中打开页面,例如Chrome并研究页面和服务器之间的交互是如何完成的,通常可以在开发人员工具的网络选项卡中看到此信息,因此,您可以制定一个Python脚本以使用请求库来执行步骤

您可以使用Selenium-Python进行模拟您的浏览器交互(包括JavaScript调用),直到到达您感兴趣的数据所属的页面。

最新更新