我曾尝试使用Yahoo Pipes中的Fetch Page模块来获取下面页面的内容,但没有成功:
示例链接
问题是,当你第一次在浏览器中访问该页面时,你可以选择登录,而这就是雅虎!管道获取页面模块获取。但是,在浏览器中刷新页面后,登录屏幕将替换为包含表的页面,该表包含我要提取的信息。
有没有一种方法可以调出"第二个"页面,可能是使用YQL,或者在另一个网页中使用某种形式的脚本,从包含数据的页面中获取HTML,这样我就可以在我的Pipe中使用它了?
如有任何帮助,我们将不胜感激。
目标页面为会话跟踪/验证设置浏览器cookie,而Yahoo Pipes或YQL无法处理这些cookie。
您需要询问是否在PHP Web服务器或谷歌应用程序引擎上使用cURL来获取数据,因为cURL还可以存储发送给它的任何cookie,如果需要,还可以使用自定义cookie进行回复。