记住这个问题。我能够很好地检索网站的所有信息,除了在我收到内容回复后(我想)用Jquery加载的信息。
有没有办法获得动态加载的内容?我已经试着在谷歌和这里搜索过了,但不知道如何很好地描述我的问题。。
简单情况:我有这个网站,上面有汽车信息:http://www.autowiki.nl/autovergelijker有不同的下线,最重要的是例如"merk"(汽车品牌)当我选择一个汽车品牌时,型号的下拉列表中已经填充了匹配的品牌(这也会更改url)
所以如果我访问网站http://www.autowiki.nl/autovergelijker/#merk_1=15然后我在浏览器中看到品牌下拉列表中包含"现代",下拉模型中包含匹配的现代模型
我想要什么读取下拉列表中的所有型号
我的代码
Dim page as HtmlWeb = New HtmlWeb
Dim doc as HtmlDocument = page.Load('http://www.autowiki.nl/autovergelijker/#merk_1=15')
Dim crawlstring as String = doc.DocumentNode.SelectSingleNode("//select[@id='model_1']").InnerHtml
我得到的爬网字符串包含一个选项,它是empy的"---"。而不是匹配的型号
使用C#
var list=new List<yourVar>();var web = new HtmlWeb();
var doc = web.Load("http://www.autowiki.nl/autovergelijker/#merk_1=15");
var xpath = "//select[@id='model_1']//option[@value]";foreach (HtmlNode Node in doc.DocumentNode.SelectNodes(xpath)){
var yourVar=Node.Attributes["value"].Value;list.Add(yourVar);}