当使用Javascript加载内容时,如何使用Nokogiri解析页面



我正试图解析Twitch.tv网站上的一些内容,作为Nokogiri的学习练习。

当获取HTML文档时,我没有得到我在Google Chrome上看到的源代码,内容似乎是通过Javascript加载的,而不是在最初的get请求中加载的。

如何使用Nokogiri解析该网站的流列表?或者更一般地说,如何解析DOM加载完成后动态加载的内容?

数据是json,因此不使用nokogiri。例如:

require 'open-uri'
require 'json'
hash = JSON.parse open('http://api.twitch.tv/kraken/games/top?limit=10&on_site=1').read

相关内容

  • 没有找到相关文章

最新更新