我已经读到过如何通过jQuery或使用跨域请求从另一个网页获取源代码的方法。我想尝试做的是让它在每次加载页面时都抓住一个具有不同代码的div,而不是整个源代码。例如,当您使用"inspect element"或 firebug 等工具更深入地了解页面代码时,您会看到更多细节。
我会使用相同的方法之一吗?
是的。
如果您同时控制两个域,则可以添加Access_control_CORS
标头以允许访问跨域请求并使用像phantomJS这样的无头浏览器来获取缓存版本的呈现HTML
页面。
如果您不控制这两个域,则必须编写服务器侧代理来获取页面及其所有资源(您将拥有解析页面以获取或重写指向图像,JavaScript的链接,样式表等)然后通过phantomJS
运行它以创建一个 HTML
快照。
源:
https://developer.mozilla.org/en-US/docs/Web/Security/Same-origin_policy
https://developer.mozilla.org/en-US/docs/Web/HTTP/Access_control_CORS
http://phantomjs.org/
注意:尽管我尽了最大的努力,但堆栈溢出绝对相信这些链接是代码。很抱歉作为代码发布。