我正试图解析Twitch.tv网站上的一些内容,作为Nokogiri的学习练习。
当获取HTML文档时,我没有得到我在Google Chrome上看到的源代码,内容似乎是通过Javascript加载的,而不是在最初的get请求中加载的。
如何使用Nokogiri解析该网站的流列表?或者更一般地说,如何解析DOM加载完成后动态加载的内容?
数据是json,因此不使用nokogiri。例如:
require 'open-uri'
require 'json'
hash = JSON.parse open('http://api.twitch.tv/kraken/games/top?limit=10&on_site=1').read