使用HtmlWeb.Load爬网jquery加载的内容



记住这个问题。我能够很好地检索网站的所有信息,除了在我收到内容回复后(我想)用Jquery加载的信息。

有没有办法获得动态加载的内容?我已经试着在谷歌和这里搜索过了,但不知道如何很好地描述我的问题。。

简单情况:我有这个网站,上面有汽车信息:http://www.autowiki.nl/autovergelijker有不同的下线,最重要的是例如"merk"(汽车品牌)当我选择一个汽车品牌时,型号的下拉列表中已经填充了匹配的品牌(这也会更改url)

所以如果我访问网站http://www.autowiki.nl/autovergelijker/#merk_1=15然后我在浏览器中看到品牌下拉列表中包含"现代",下拉模型中包含匹配的现代模型

我想要什么读取下拉列表中的所有型号

我的代码

Dim page as HtmlWeb = New HtmlWeb
Dim doc as HtmlDocument = page.Load('http://www.autowiki.nl/autovergelijker/#merk_1=15')
Dim crawlstring as String = doc.DocumentNode.SelectSingleNode("//select[@id='model_1']").InnerHtml

我得到的爬网字符串包含一个选项,它是empy的"---"。而不是匹配的型号

使用C#

var list=new List<yourVar>();var web = new HtmlWeb(); var doc = web.Load("http://www.autowiki.nl/autovergelijker/#merk_1=15"); var xpath = "//select[@id='model_1']//option[@value]";foreach (HtmlNode Node in doc.DocumentNode.SelectNodes(xpath)){ var yourVar=Node.Attributes["value"].Value;list.Add(yourVar);}

最新更新