我正在尝试刮擦一个服务结果的政府网站,没有章鱼中没有下一个按钮。
分页的示例
是否有一种非记忆方式来格式化相对XPath,以便按顺序单击下一个页面?
Page One = .//*[@id='datagrid_results']/tbody/tr[42]/td/a[1]
Page Two = .//*[@id='datagrid_results']/tbody/tr[42]/td/a[2]
我已经尝试了章鱼教程,但是他们只提及如何在有下一个按钮的情况下循环。这是我最好使用硒的情况吗?
我让它与并发脚本运行一起工作,这很好,因为章鱼限制了任何一个刮擦的结果。我所做的是复制一个脚本,然后单击"结果的第二页",第41-80页。然后,我复制了该脚本,并在结果的第三页(81-120 ...等)上添加了第二次单击。它在没有其他任何事情的情况下工作,因为相对XPath完全相同。