我正在使用splashr包(用于动态web抓取(,这是硒的一个有用的替代方案,目前似乎还没有更新。我在这里学习教程。
https://github.com/hrbrmstr/splashr
我特别感兴趣的是splasher的splash_click()
函数。当我浏览页面底部的示例时,它似乎不适合我
splash_local %>%
splash_plugins(TRUE) %>%
splash_go("https://gis.cdc.gov/GRASP/Fluview/FluHospRates.html") %>%
splash_wait(4) %>%
splash_click(460, 550) %>%
splash_wait(2) %>%
splash_click(230, 85) %>%
splash_wait(2) %>%
splash_png()
返回给我的png被您访问该网站时最初出现的弹出窗口所覆盖。换句话说,splash_click()
似乎对我不起作用。阅读文档时,我注意到splash_click()
函数中的坐标需要"相对于视口"。我不知道这意味着什么,但我猜我的不是。
我怎样才能确定我使用的是正确的coords?
在splash_wait(4(之后,尝试插入splash_send_keys("(%>%以关闭弹出窗口。